← กลับหน้าหลัก
MINI-HACKATHON 4

Individual Hackathon

24 ชั่วโมง 5 โจทย์ คนเดียว — จาก Computer Vision ถึง Multimodal

5 AI challenges illustration
ABOUT THE COMPETITION

เกี่ยวกับการแข่งขัน + กลยุทธ์

Platform & Timeline

แข่งบน Kaggle วันที่ 3–4 เมษายน 2569 มีเวลา 24 ชั่วโมง ส่งได้ 5 ครั้งต่อวันต่อโจทย์

กลยุทธ์ส่วนตัว

5 โจทย์ คนเดียว — ต้องตัดสินใจให้เร็วว่าจะลงลึกโจทย์ไหน และโจทย์ไหนส่ง baseline แล้วรีบไปต่อ ไม่มีเวลามานั่งทำทุกอย่างให้สมบูรณ์แบบหมดทุกข้อ

1

House Recognition

Computer Vision
Dataset
2,954 / 1,550
Total Data
~1.35 GB
Metric
Accuracy
Task Type
Binary Classification

โจทย์ที่สำคัญ

แยกว่าภาพมีบ้านหรือไม่ — ฟังดูง่าย แต่มันซับซ้อนกว่าที่คิด เพราะต้องแยกระหว่าง "ภาพที่มีบ้านเป็นจุดเด่น" กับ "ภาพที่มีบ้านอยู่แค่มุมเล็กๆ"

แนวทาง

  • Transfer Learning: EfficientNet กับ Vision Transformer ทำ Data Augmentation (พลิก หมุน ปรับสี)
  • Test Time Augmentation: ทำนายจากหลายวิวของรูปเดียวแล้วหาเฉลี่ย
  • Self-distillation (DINO-lite): ถ้ามีเวลา ผมอยากลองทำ Self-distillation แบบ DINO-lite ด้วย
  • Ensemble: รวมหลาย model เพื่อหาความเห็นเอกฉันท์
📓 hack4-1-house-recognition.ipynb
2

Thai Word Segmentation

NLP
Corpus
LST20
Test Characters
37,248
Metric
F1-Score (Macro)
Task Type
Sequence Labeling

โจทย์ที่สำคัญ

ตัดคำภาษาไทยระดับตัวอักษร — ติด tag B (เริ่มคำ) I (กลางคำ) E (ท้ายคำ) ให้แต่ละตัวอักษร ภาษาไทยไม่มีการเว้นวรรคระหว่างคำ และนิยามคำของ LST20 อาจต่างจากพจนานุกรมทั่วไป

แนวทาง

  • Baseline PyThaiNLP: ลองก่อนด้วย library มาตรฐาน (~65-75% F1)
  • WangchanBERTa + CRF: ใช้ BERT ที่ pretrained บนข้อมูลไทย + Conditional Random Field layer
  • Dictionary + Neural Ensemble: รวมระบบ dictionary-based กับ neural network
  • Character Embeddings: Fine-tune embedding สำหรับคำไทยที่ปรากฏน้อย
📓 hack4-2-word-segmentation.ipynb
3

Sleep Stage Classification

Signal Processing
Classes
5 stages (W, N1, N2, N3, R)
Channels
8 (wearable sensor)
Samples
~7,833 segments
Metric
F1 (Weighted)

โจทย์ที่สำคัญ

จำแนก 5 ระยะการนอน — ตื่น (W), หลับตื้น N1/N2, หลับลึก N3 และ REM จากข้อมูล wearable sensor 8 ช่อง 30 วินาทีต่อ segment ที่ 16 Hz ความท้าทายคือการแยกระหว่างระยะที่คล้ายกัน

แนวทาง

  • Feature Engineering: Statistical features (mean, std, skewness, kurtosis) + FFT + HRV metrics
  • XGBoost/LightGBM Baseline: ทรี-based models ที่ทำงานดีกับ tabular features
  • CNN + LSTM Temporal: จับความสัมพันธ์ตามเวลาและรูปแบบเชิงพื้นที่
  • Subject-adaptive Normalization: normalize ข้อมูลต่าง subject แยกกัน
  • Class Rebalancing: ใช้ weighted loss หรือ SMOTE สำหรับ class ที่ไม่สมดุล
📓 hack4-3-sleep-stage-classification.ipynb
4

Heart Disease Prediction

Tabular ML
Train/Test
223,084 / 74,361
Features
12 binary, 2 num., 4 cat.
Metric
F2-Score
Task Type
Binary Classification

โจทย์ที่สำคัญ

ทำนายว่ามีโรคหัวใจหรือไม่ — จุดสำคัญคือใช้ F2-Score ที่ให้น้ำหนัก recall มากกว่า precision ถึง 4 เท่า หมายความว่า พลาดผู้ป่วยจริงมีโทษหนักกว่าแจ้งเตือนผิด

แนวทาง

  • Feature Engineering: สร้าง metabolic syndrome score, cardiovascular risk index
  • Stacking Ensemble: LightGBM, XGBoost, CatBoost, Random Forest เป็น Level 0, LogisticRegression รวมผล
  • F2-optimized Threshold: หา threshold ที่ optimize F2 ไม่ใช้ 0.5 แบบ default
  • Hyperparameter Tuning: Optuna หรือ GridSearch บน validation fold
  • Cross-validation: Stratified K-fold เพื่อเก็บสัดส่วน class
📓 hack4-4-heart-disease-prediction.ipynb
5

Thai Image Captioning

Multimodal
Input
Images
Output
Thai Captions
Metric
BLEU Score
Task Type
Generation

โจทย์ที่สำคัญ

สร้างคำบรรยายภาษาไทยจากรูปภาพ — ต้องถูกทั้งเนื้อหาและไวยากรณ์ ความท้าทายคือการเชื่อมวิศัยทัศน์คอมพิวเตอร์กับการประมวลผลภาษาธรรมชาติในโลกมัลติโมดัล

แนวทาง

  • Vision Encoder: CLIP image encoder (pretrained) เพื่อแยกลักษณะเชิงความหมาย
  • Fine-tune Thai Language Model: เอา Thai-LLM (เช่น WangchanGPT หรือ Thai-Llama) มา fine-tune
  • Beam Search Decoding: ไม่ใช้ greedy; ให้ model explore หลาย path เพื่อหาข้อความดีที่สุด
  • Evaluate with BLEU: วัดความคล้ายคลึงระหว่าง predicted captions กับ ground truth
  • Fusion Architecture: concat หรือ cross-attention ระหว่าง image embedding และ text embedding
📓 hack4-5-thai-image-captioning.ipynb
DOWNLOAD

ดาวน์โหลดทั้ง 5 Notebooks

hack4-1-house-recognition.ipynb

Computer Vision - Binary Classification

Download →

hack4-2-word-segmentation.ipynb

NLP - Sequence Labeling

Download →

hack4-3-sleep-stage-classification.ipynb

Signal Processing - Multi-class

Download →

hack4-4-heart-disease-prediction.ipynb

Tabular ML - Binary Classification

Download →

hack4-5-thai-image-captioning.ipynb

Multimodal - Text Generation

Download →