MINI-HACKATHON 4

Individual Hackathon

24 ชั่วโมง 5 โจทย์ คนเดียว — จาก Computer Vision ถึง Multimodal

ABOUT THE COMPETITION

เกี่ยวกับการแข่งขัน + กลยุทธ์

Platform & Timeline

แข่งบน Kaggle วันที่ 3–4 เมษายน 2569 มีเวลา 24 ชั่วโมง ส่งได้ 5 ครั้งต่อวันต่อโจทย์

กลยุทธ์ส่วนตัว

5 โจทย์ คนเดียว — ต้องตัดสินใจให้เร็วว่าจะลงลึกโจทย์ไหน และโจทย์ไหนส่ง baseline แล้วรีบไปต่อ ไม่มีเวลามานั่งทำทุกอย่างให้สมบูรณ์แบบหมดทุกข้อ

1

House Recognition

Computer Vision

Dataset

2,954 / 1,550

Total Data

~1.35 GB

Metric

Accuracy

Task Type

Binary Classification

โจทย์ที่สำคัญ

แยกว่าภาพมีบ้านหรือไม่ — ฟังดูง่าย แต่มันซับซ้อนกว่าที่คิด เพราะต้องแยกระหว่าง "ภาพที่มีบ้านเป็นจุดเด่น" กับ "ภาพที่มีบ้านอยู่แค่มุมเล็กๆ"

แนวทาง

• Transfer Learning: EfficientNet กับ Vision Transformer ทำ Data Augmentation (พลิก หมุน ปรับสี)
• Test Time Augmentation: ทำนายจากหลายวิวของรูปเดียวแล้วหาเฉลี่ย
• Self-distillation (DINO-lite): ถ้ามีเวลา ผมอยากลองทำ Self-distillation แบบ DINO-lite ด้วย
• Ensemble: รวมหลาย model เพื่อหาความเห็นเอกฉันท์

📓 hack4-1-house-recognition.ipynb

2

Thai Word Segmentation

NLP

Corpus

LST20

Test Characters

37,248

Metric

F1-Score (Macro)

Task Type

Sequence Labeling

โจทย์ที่สำคัญ

ตัดคำภาษาไทยระดับตัวอักษร — ติด tag B (เริ่มคำ) I (กลางคำ) E (ท้ายคำ) ให้แต่ละตัวอักษร ภาษาไทยไม่มีการเว้นวรรคระหว่างคำ และนิยามคำของ LST20 อาจต่างจากพจนานุกรมทั่วไป

แนวทาง

• Baseline PyThaiNLP: ลองก่อนด้วย library มาตรฐาน (~65-75% F1)
• WangchanBERTa + CRF: ใช้ BERT ที่ pretrained บนข้อมูลไทย + Conditional Random Field layer
• Dictionary + Neural Ensemble: รวมระบบ dictionary-based กับ neural network
• Character Embeddings: Fine-tune embedding สำหรับคำไทยที่ปรากฏน้อย

📓 hack4-2-word-segmentation.ipynb

3

Sleep Stage Classification

Signal Processing

Classes

5 stages (W, N1, N2, N3, R)

Channels

8 (wearable sensor)

Samples

~7,833 segments

Metric

F1 (Weighted)

โจทย์ที่สำคัญ

จำแนก 5 ระยะการนอน — ตื่น (W), หลับตื้น N1/N2, หลับลึก N3 และ REM จากข้อมูล wearable sensor 8 ช่อง 30 วินาทีต่อ segment ที่ 16 Hz ความท้าทายคือการแยกระหว่างระยะที่คล้ายกัน

แนวทาง

• Feature Engineering: Statistical features (mean, std, skewness, kurtosis) + FFT + HRV metrics
• XGBoost/LightGBM Baseline: ทรี-based models ที่ทำงานดีกับ tabular features
• CNN + LSTM Temporal: จับความสัมพันธ์ตามเวลาและรูปแบบเชิงพื้นที่
• Subject-adaptive Normalization: normalize ข้อมูลต่าง subject แยกกัน
• Class Rebalancing: ใช้ weighted loss หรือ SMOTE สำหรับ class ที่ไม่สมดุล

📓 hack4-3-sleep-stage-classification.ipynb

4

Heart Disease Prediction

Tabular ML

Train/Test

223,084 / 74,361

Features

12 binary, 2 num., 4 cat.

Metric

F2-Score

Task Type

Binary Classification

โจทย์ที่สำคัญ

ทำนายว่ามีโรคหัวใจหรือไม่ — จุดสำคัญคือใช้ F2-Score ที่ให้น้ำหนัก recall มากกว่า precision ถึง 4 เท่า หมายความว่า พลาดผู้ป่วยจริงมีโทษหนักกว่าแจ้งเตือนผิด

แนวทาง

• Feature Engineering: สร้าง metabolic syndrome score, cardiovascular risk index
• Stacking Ensemble: LightGBM, XGBoost, CatBoost, Random Forest เป็น Level 0, LogisticRegression รวมผล
• F2-optimized Threshold: หา threshold ที่ optimize F2 ไม่ใช้ 0.5 แบบ default
• Hyperparameter Tuning: Optuna หรือ GridSearch บน validation fold
• Cross-validation: Stratified K-fold เพื่อเก็บสัดส่วน class

📓 hack4-4-heart-disease-prediction.ipynb

5

Thai Image Captioning

Multimodal

Input

Images

Output

Thai Captions

Metric

BLEU Score

Task Type

Generation

โจทย์ที่สำคัญ

สร้างคำบรรยายภาษาไทยจากรูปภาพ — ต้องถูกทั้งเนื้อหาและไวยากรณ์ ความท้าทายคือการเชื่อมวิศัยทัศน์คอมพิวเตอร์กับการประมวลผลภาษาธรรมชาติในโลกมัลติโมดัล

แนวทาง

• Vision Encoder: CLIP image encoder (pretrained) เพื่อแยกลักษณะเชิงความหมาย
• Fine-tune Thai Language Model: เอา Thai-LLM (เช่น WangchanGPT หรือ Thai-Llama) มา fine-tune
• Beam Search Decoding: ไม่ใช้ greedy; ให้ model explore หลาย path เพื่อหาข้อความดีที่สุด
• Evaluate with BLEU: วัดความคล้ายคลึงระหว่าง predicted captions กับ ground truth
• Fusion Architecture: concat หรือ cross-attention ระหว่าง image embedding และ text embedding

📓 hack4-5-thai-image-captioning.ipynb

DOWNLOAD

ดาวน์โหลดทั้ง 5 Notebooks

hack4-1-house-recognition.ipynb

Computer Vision - Binary Classification

Download →

hack4-2-word-segmentation.ipynb

NLP - Sequence Labeling

Download →

hack4-3-sleep-stage-classification.ipynb

Signal Processing - Multi-class

Download →

hack4-4-heart-disease-prediction.ipynb

Tabular ML - Binary Classification

Download →

hack4-5-thai-image-captioning.ipynb

Multimodal - Text Generation

Download →