← กลับหน้าหลัก
Mini-Hackathon 1

ชีพจรกรุงเทพฯ

เล่าเรื่องข้อมูลระบบรางของกรุงเทพฯ ผ่าน Data Storytelling

Bangkok transit data visualization
เกี่ยวกับการแข่งขัน

เกี่ยวกับการแข่งขัน

การแข่งขัน

From Data to Insight จัดโดย Big Data Institute (BDI) ผ่านแพลตฟอร์ม THackle

ช่วงเวลา

11–31 มีนาคม 2569 (ประมาณ 3 สัปดาห์)

ผู้เข้าร่วม

689 ทีม จากทั่วประเทศ

โจทย์ที่ผมเลือก

Hack 5 — การเดินทางด้วยระบบขนส่งสาธารณะ

ข้อมูลที่ได้

ตัวเลขผู้โดยสารรายวันจากกระทรวงคมนาคม ครอบคลุมราว 14 เดือน (2568–2569)

ระบบที่วิเคราะห์

BTS, MRT สายสีน้ำเงิน ม่วง เหลือง ชมพู, Airport Rail Link และสายสีแดง

1

คนกรุงเทพฯ เดินทางด้วยอะไรมากที่สุด?

พอได้ข้อมูลมา สิ่งแรกที่ผมอยากรู้คือ — แล้วคนกรุงเทพฯ พึ่งพาระบบไหนเป็นหลักกันแน่?

คำตอบชัดเจนมาก BTS คือ 'ราชา' ของระบบรางเมืองนี้ ปี 2568 รับผู้โดยสาร 263.99 ล้านเที่ยว หรือเกินครึ่ง (50.86%) ของทั้งระบบ MRT รวม 4 สายตามมาที่ 218.18 ล้านเที่ยว (42.03%) รวมแค่สองแกนหลักนี้ก็กินส่วนแบ่งไปแล้ว 92.89%

แต่ที่น่าสนใจคือตอนผมเทียบช่วงเวลาเดียวกัน (1 ม.ค.–11 มี.ค.) ของทั้งสองปี กลับพบว่า BTS หดตัวหนักสุดที่ -8.85% ขณะที่ ARL กลับโตขึ้น +1.87% ส่วนแบ่งของ BTS ลดจาก 51.11% เหลือ 49.47% — สัญญาณว่าการเติบโตเริ่มกระจายไปยังระบบรองแล้ว

ผมเลือกเทียบเฉพาะช่วงเวลาที่ตรงกัน (matched period) เพราะข้อมูลปี 2569 มีแค่ 70 วัน — ถ้าเอาทั้งปี 2568 มาเทียบกับ 70 วันของปี 2569 งานจะดู 'ครบ' แต่มันไม่ 'ถูก' ครับ
2

แต่ละสายมี 'บุคลิก' ต่างกันอย่างไร?

คำถามนี้เป็นส่วนที่ผมชอบที่สุด — เพราะมันทำให้เห็นว่ารถไฟฟ้าแต่ละสายไม่ได้เป็นแค่ 'ตัวเลข' แต่มี character ของตัวเอง

ตัวเลขเฉลี่ยต่อวัน (435 วัน): BTS 721,925 คน | MRT น้ำเงิน 428,056 | MRT ม่วง 67,454 | ARL 65,933 | MRT ชมพู 61,824 | MRT เหลือง 45,551 | สายสีแดง 36,466

แต่เรื่องจริงไม่ได้อยู่ที่ยอดเฉลี่ย — อยู่ที่ 'บุคลิก':

MRT ม่วง

สาย commuter ตัวจริง — ค่า CV สูงสุดที่ 28.86% คนใช้วันธรรมดาเป็น 1.81 เท่าของวันหยุด

MRT ชมพู

Friday effect สูงสุด +11.05% ความผันผวนสูง 19.48% — ยังอยู่ในช่วง 'หาตัวตน' ว่าคนจะใช้มันเพื่ออะไร

ARL

นิ่งและเสถียรที่สุด — CV แค่ 20.09% ใช้สม่ำเสมอทั้งสัปดาห์

BTS

ฐานใหญ่ที่สุด ความผันผวนต่ำสุด 13.43% — คือ 'โครงสร้างหลักของเมือง' ที่ทุกคนพึ่งพา

รถไฟฟ้าแต่ละสายไม่ได้แข่งกันแบบสินค้าชนิดเดียวกัน — บางสายขาย 'ความสม่ำเสมอ' บางสายขาย 'การพาคนเข้าเมือง' และบางสายยังหาอยู่ว่าคนจะใช้มันเพื่ออะไร
3

วันหยุดกับเทศกาล 'เห็น' ในข้อมูลไหม?

คำตอบคือเห็นชัดมากๆ ครับ เหมือนเมืองหายใจเบาลงทุกครั้งที่ถึงวันหยุด

จุดที่ผู้โดยสารหายไปเยอะสุด:

แต่ก็มีวันที่คนแห่ออกมาใช้มากผิดปกติ เช่น 29–31 ม.ค. 2025 ช่วงตรุษจีน พุ่งขึ้น +44% ถึง +48%

จุดที่ผมต้องระวังเป็นพิเศษ: 10 ธ.ค. 2025 ข้อมูลแสดง -61.99% ดูเหมือน mobility collapse แต่ผมตรวจสอบแล้วพบว่า MRT 4 สาย ข้อมูลหายทั้งวัน — นี่คือ data-quality anomaly ไม่ใช่เหตุการณ์จริง ผมจึงแยกมันออกจากการวิเคราะห์

สิ่งที่ทำให้แตกต่าง

สิ่งที่ทำให้งานนี้แตกต่าง

ไม่หลงเทียบข้อมูลผิดช่วงเวลา

เพราะถ้าเทียบทั้งปีกับ 70 วัน มันจะได้ตัวเลขที่ดูดีแต่ไม่จริง

มองไกลกว่าแค่ 'ใครมากสุด'

ขยับไปถึงว่าระบบไหนเป็น backbone ระบบไหนกำลังเกิด

วิเคราะห์ 'บุคลิก' ไม่ใช่แค่ปริมาณ

เพราะตัวเลขเฉลี่ยอย่างเดียวเล่าเรื่องได้ไม่หมด

แยก data-quality anomaly ออกจาก event anomaly

ไม่ปล่อยให้ข้อมูลเสียทำให้ insight ผิด

Jupyter Notebook

ศึกษาโค้ด analysis และ visualization ทั้งหมด

ดาวน์โหลด