Transformer (ทรานส์ฟอร์เมอร์) คืออะไร?
สถาปัตยกรรมเครือข่ายประสาทที่ใช้กลไก attention ในการประมวลผลภาษาอย่างมีประสิทธิภาพมาก
คำนิยาม
Transformer คือประเภทของสถาปัตยกรรมเครือข่ายประสาทที่ใช้ "attention mechanism" เพื่อประมวลผลข้อมูลลำดับ (เช่น ข้อความ) อย่างมีประสิทธิภาพมาก
วัตถุประสงค์
เพื่อให้ได้ประสิทธิภาพที่ดีกว่าในการสร้างโมเดลภาษา การแปลด้วยเครื่อง การสร้างข้อความ และงาน NLP อื่น ๆ
การทำงาน
ใช้กลไก self-attention เพื่อดูข้อความทุกส่วนพร้อมกันและเข้าใจว่าคำไหนสำคัญต่อกันบ้าง
ตัวอย่าง
โมเดลภาษาหลักทั้งหมด เช่น GPT, BERT, T5 ล้วนอิงบนสถาปัตยกรรม Transformer
เกี่ยวข้อง
- Attention Mechanism (กลไกการให้ความสนใจ)
- Self-Attention (การให้ความสนใจตนเอง)
- BERT (เบิร์ต)
- GPT (จีพีที)
ต้องการเรียนรู้เพิ่มเติมหรือไม่?
หากคุณอยากทราบเพิ่มเติมเกี่ยวกับ Transformer (ทรานส์ฟอร์เมอร์), ติดต่อฉันผ่าน X ฉันชอบแบ่งปันความคิด ตอบคำถาม และพูดคุยเกี่ยวกับความน่าสนใจในหัวข้อนี้ อย่าลังเลที่จะเข้ามาพูดคุยกันนะ แล้วเจอกัน!
Neural Network (เครือข่ายประสาท) คืออะไร?
Neural Network หรือเครือข่ายประสาท คือโมเดลคอมพิวเตอร์ที่เลียนแบบการทำงานขอ...
Deep Learning (การเรียนรู้เชิงลึก) คืออะไร?
Deep Learning หรือการเรียนรู้เชิงลึก คือสาขาเฉพาะของการเรียนรู้ของเครื่องที...
Chain of Thought คืออะไร?
Chain of Thought (CoT) คือเทคนิค Prompting ที่กระตุ้นให้โมเดล AI แสดงกระบวน...
AI (ปัญญาประดิษฐ์) คืออะไร?
AI หรือปัญญาประดิษฐ์ (Artificial Intelligence) คือสาขาวิชาที่กว้างขวางในการ...
AI Automation คืออะไร?
AI Automation คือการใช้ปัญญาประดิษฐ์เพื่อดำเนินงาน ตัดสินใจ และดำเนินกระบวน...