24 ชั่วโมง 5 โจทย์ คนเดียว — จาก Computer Vision ถึง Multimodal
แข่งบน Kaggle วันที่ 3–4 เมษายน 2569 มีเวลา 24 ชั่วโมง ส่งได้ 5 ครั้งต่อวันต่อโจทย์
5 โจทย์ คนเดียว — ต้องตัดสินใจให้เร็วว่าจะลงลึกโจทย์ไหน และโจทย์ไหนส่ง baseline แล้วรีบไปต่อ ไม่มีเวลามานั่งทำทุกอย่างให้สมบูรณ์แบบหมดทุกข้อ
แยกว่าภาพมีบ้านหรือไม่ — ฟังดูง่าย แต่มันซับซ้อนกว่าที่คิด เพราะต้องแยกระหว่าง "ภาพที่มีบ้านเป็นจุดเด่น" กับ "ภาพที่มีบ้านอยู่แค่มุมเล็กๆ"
ตัดคำภาษาไทยระดับตัวอักษร — ติด tag B (เริ่มคำ) I (กลางคำ) E (ท้ายคำ) ให้แต่ละตัวอักษร ภาษาไทยไม่มีการเว้นวรรคระหว่างคำ และนิยามคำของ LST20 อาจต่างจากพจนานุกรมทั่วไป
จำแนก 5 ระยะการนอน — ตื่น (W), หลับตื้น N1/N2, หลับลึก N3 และ REM จากข้อมูล wearable sensor 8 ช่อง 30 วินาทีต่อ segment ที่ 16 Hz ความท้าทายคือการแยกระหว่างระยะที่คล้ายกัน
ทำนายว่ามีโรคหัวใจหรือไม่ — จุดสำคัญคือใช้ F2-Score ที่ให้น้ำหนัก recall มากกว่า precision ถึง 4 เท่า หมายความว่า พลาดผู้ป่วยจริงมีโทษหนักกว่าแจ้งเตือนผิด
สร้างคำบรรยายภาษาไทยจากรูปภาพ — ต้องถูกทั้งเนื้อหาและไวยากรณ์ ความท้าทายคือการเชื่อมวิศัยทัศน์คอมพิวเตอร์กับการประมวลผลภาษาธรรมชาติในโลกมัลติโมดัล