20/07/2024
OpenAI พัฒนาเทคนิค Instruction Hierarchy เพื่อเพิ่มความปลอดภัยให้กับ GPT-4o Mini โดยมีวัตถุประสงค์เพื่อป้องกันการใช้งานผิดวัตถุประสง
OpenAI อัพเดทความปลอดภัยใหม่ ให้ GPT-4o mini ด้วยเทคนิค Instruction Hierarchy
-OpenAI พัฒนาเทคนิค Instruction Hierarchy เพื่อเพิ่มความปลอดภัยให้กับ GPT-4o Mini
โดยมีวัตถุประสงค์เพื่อ
- ป้องกันการใช้งานผิดวัตถุประสงค์
- ป้องกันคำสั่งที่ไม่ได้รับอนุญาต
-วิธีการทำงานของ Instruction Hierarchy คือ
- ให้ความสำคัญกับคำสั่งต้นฉบับของนักพัฒนามากกว่าคำสั่งของผู้ใช้
- หากมีความขัดแย้งระหว่างคำสั่ง ระบบจะยึดตามคำสั่งของนักพัฒนาเป็นหลัก
- GPT-4o Mini คือโมเดลแรกที่ได้รับการอัพเดตด้านความปลอดภัยนี้
- โดย GPT-4o Mini เป็นโมเดล AI ขนาดเล็ก ประมวลผลเร็ว ราคาถูกกว่ารุ่นอื่น
- ช่วยป้องกันการใช้คำสั่ง Ignore all previous instructions ที่เคยใช้เพื่อหลอก AI
—--------
Ignore all previous instructions คืออะไร?
คือวิธีที่ผู้ใช้พยายาม Hack หรือหลอก AI แบบ LLMs
โดยผู้ใช้สั่งให้ AI ลืมคำสั่งเดิมทั้งหมดที่ถูกตั้งโปรแกรมไว้
เป้าหมายคือทำให้ AI ทำงานนอกเหนือจากที่ถูกออกแบบไว้
มักใช้เพื่อความสนุก หรือทดสอบข้อจำกัดของ AI
จึงเป็นช่องโหว่ด้านความปลอดภัยที่สำคัญใน AI รุ่นก่อนๆ
OpenAI จึงพยายามแก้ไขปัญหานี้ด้วยเทคนิค Instruction Hierarchy ในโมเดลใหม่ๆในปัจจุบัน
—------
- เป้าหมายของ OpenAI คือ
- พัฒนา ChatGPT ไปถึงระดับ AI Agents ที่สามารถทำงานอัตโนมัติได้อย่างปลอดภัย
- สร้างระบบที่สามารถจัดการชีวิตให้กับผู้ใช้งานได้
- การอัพเดทระบบครั้งนี้มีประโยชน์เพื่อ
- ป้องกันการใช้ AI ในทางที่ผิด เช่น การส่งข้อมูลส่วนตัวไปยังบุคคลที่สาม หรือใช้ในการหลอกลวงผู้อื่น
- เพิ่มความน่าเชื่อถือให้กับ OpenAI หลังจากเจอปัญหาเรื่องความปลอดภัยจากข่าวการโดนแฮค
- จุดเริ่มต้นพัฒนาระบบป้องกัน AI ที่มีความซับซ้อนมากขึ้น
——
พูดคุยและแลกเปลี่ยน อัพเดทข่าวสาร AI และ การตลาด ได้ที่กลุ่ม
https://bit.ly/3XNW3mJ
#การตลาด #ปัญญาประดิษฐ์