ความปลอดภัย จริยธรรม และการกำกับดูแล

ขั้นตอน Audit สำหรับโครงการ LLM เก็บหลักฐานและรายงานต่อผู้บริหาร: แนวทางเชิงปฏิบัติสำหรับการตรวจสอบ ความน่าเชื่อถือ และการจัดทำรายงาน

ขั้นตอน Audit สำหรับโครงการ LLM เก็บหลักฐานและรายงานต่อผู้บริหาร: แนวทางเชิงปฏิบัติสำหรับการตรวจสอบ ความน่าเชื่อถือ และการจัดทำรายงาน ในยุคที่ Generative AI และ Large Language Models (LLMs) กลายเป็นหัวใจสำคัญของการขับเคลื่อนธุรกิจ การตรวจสอบ (Audit) โครงการ

Read More
ความปลอดภัย จริยธรรม และการกำกับดูแล

พื้นฐานและเจตนาของการสร้างชุดทดสอบ evals (ทำไมต้องมีและวัดอะไร)

พื้นฐานและเจตนาของการสร้างชุดทดสอบ evals (ทำไมต้องมีและวัดอะไร) ในยุคที่โมเดลปัญญาประดิษฐ์ (AI) โดยเฉพาะโมเดลภาษาขนาดใหญ่ (LLMs) เข้ามามีบทบาทสำคัญในชีวิตประจำวัน การประเมินความสามารถและความน่าเชื่อถือของพวกมันจึงเป็นเรื่องที่สำคัญอย่างยิ่งยวด เครื่องมือที่ใช้ในการตรวจสอบความสามารถเหล่านี้อย่างเป็นระบบคือ ชุดทดสอบ evals (Evaluation Suites) บทความนี้จะเจาะลึกถึงพื้นฐาน เจตนา และสิ่งที่ชุดทดสอบเหล่านี้พยายามวัดผล เพื่อให้เข้าใจถึงความจำเป็นในการมีอยู่ของพวกมันในการพัฒนา AI ที่ปลอดภัยและมีประสิทธิภาพ

Read More