AI ทำงานอย่างไร ใน 3 ประโยค
- Pisek Kultavewuti
- 3 ก.ค. 2566
- ยาว 1 นาที
GPT 4 ของ OpenAI เป็นโมเดล AI ที่ซับซ้อนมาก โดยหากนับเป็นพารามิเตอร์นั้นมีถึงประมาณ 100 ล้านล้านค่า อย่างไรก็ตามเราสามารถอธิบายการสร้าง AI และการทำงานของ AI โดยสรุปเพียง 3 ประโยคเท่านั้น!
โมเดล AI เป็นโครงสร้างของตรรกะหรือคณิตศาสตร์
ดังนั้น มันจึงมีค่าบางอย่าง (หรือพารามิเตอร์) ที่เอาไว้ใช้คำนวณ
อัลกอลิทึมในการเรียนหรือสอน AI จะทำให้ค่าเหล่านี้ถูกตั้งให้เหมาะสมจนทำให้ AI สามารถบรรลุหน้าที่ได้
เรามาลงรายละเอียดด้วยตัวอย่างสองตัวอย่างกัน

ตัวอย่าง A: ทำนายมวลของน้ำด้วยปริมาตร
สมมติว่าเรามีข้อมูลที่ได้มาจาการทดลองดังนี้
Volume, ปริมาตร [liter] | Mass, มวล [kg] |
1 | 1 |
2 | 2 |
3 | 3 |
4 | 4 |
เราคิดว่าจะสร้างโมเดล AI ที่สามารถทำนายหรือคำนวณมวลของน้ำได้จากปริมาตรของมัน และเราอาจจะเสนอว่าโมเดลนี้เป็นโมเดลที่มีโครงสร้างคณิตศาสตร์ดังนี้
m = x v
โดยที่ v คือปริมาตรและ m คือมวล โมเดลนี้มีค่าที่ต้องตั้งอยู่หนึ่งค่า นั้นก็คือ x.
ค่าของ x จะต้องถูกตั้งค่า อันที่จริงแล้วโจทย์นี้เรียกว่า regression อัลกอริทึมการเรียนรู้ที่เหมาะกับโจทย์ประเภทนี้จะทำให้ค่าของ x เป็น 1 โดยการเรียนรู้จากข้อมูลที่เรามี ดังนั้นโมเดล AI ของเราในตัวอย่างนี้ก็อาจจะเป็นโครงสร้างง่ายๆ ว่า
m = 1 v = v
ตัวอย่าง B: ทำนายว่าผู้กู้จะผิดชำระหนี้หรือไม่
ในตัวอย่างนี้ เราต้องการประเมินความเสี่ยงในการปล่อยสินเชื่อให้ผู้กู้ โดยเราสมมติว่าเรามีข้อมูลจากโปรแกรมการให้สินเชื่อก่อนหน้านี้ดังนี้
Customer ID | Salary เงินเดือน | Dependent Child จำนวนบุตร | Default ผิดชำระหนี้ |
C001 | 50,000 | 0 | No |
C002 | 60,000 | 2 | Yes |
C003 | 49,000 | 0 | Yes |
C004 | 30,000 | 1 | Yes |
แทนที่จะใช้เลขทั่วไป เราเสนอโมเดลที่เป็นตรรกะที่เรียกว่า decision tree ในแต่ละ node เราจะถามว่าเงื่อนไขเป็นจริงหรือไม่ ถ้าเป็นจริงเราจะไปต่อทางหนึ่ง แต่ถ้าเป็นเท็จเราจะไปต่ออีกทางหนึ่ง ทำเช่นนี้ไปเรื่อยๆ จนกว่าเราจะสรุปได้
ดังนั้น สำหรับโครงสร้างแนวนี้ ค่าที่เราต้องเรียนคือเงื่อนไขที่เราจะถามในแต่ละ node นั่นเอง อัลกอริทึมสำหรับ decision tree และอาจจะทำให้เราได้โมเดลดังตัวอย่างด้านล่าง หัวใจก็คืออัลกอริทึมเป็นคนตั้งเงื่อนไขโดยเรียนรู้จากข้อมูลที่เรามีให้

โบนัส--รู้งี้ แล้วไงต่อ?
ถ้าคุณเป็นนักวิจัย AI คุณอาจจะเริ่มคิด AI ที่มีโครงสร้างใหม่ๆ หรือคิดค้นอัลกอริทึมในการเรียนรู้ เมื่อคุณสร้างพวกนี้แล้วก็ต้องมาวัดผลกันข้อมูลมาตรฐาน หรือ benchmark dataset ว่าได้ผลดีกว่าโครงสร้างหรืออัลกอริทึมเดิมหรือไม่
แต่ถ้าคุณต้องการนำ AI ไปใช้ในงาน คุณต้องเน้นไปที่การเตรียมข้อมูลสำหรับการสอนโมเดลและหัดใช้โมเดล AI ที่มีอยู่ในปัจจุบันก่อน หัวใจของการสร้าง AI ที่ใช้ประโยชน์ได้อยู่ที่ข้อมูลที่จะนำมาสอนมัน
สามประโยคที่สรุปแก่นของการทำงานและการสร้างโมเดล AI
โมเดล AI เป็นโครงสร้างของตรรกะหรือคณิตศาสตร์
ดังนั้น มันจึงมีค่าบางอย่าง (หรือพารามิเตอร์) ที่เอาไว้ใช้คำนวณ
อัลกอลิทึมในการเรียนหรือสอน AI จะทำให้ค่าเหล่านี้ถูกตั้งให้เหมาะสมจนทำให้ AI สามารถบรรลุหน้าที่ได้
Comentarios