Random Walk Part 1 : Getting to Know the Stage

การที่เราจะมานั่งทำระบบเทรดสิ่งที่ผมคิดว่าสำคัญมากคือ เราต้องเข้าใจก่อนว่า “เรากำลังเจอกับอะไร?” เรากำลังทำอะไร บนสมมุติฐานของอะไร สภาพตลาดที่ว่าเป็นอย่างไรกันแน่ เชื่อว่าหลายคนก็คงจะเคยได้ยิน ทฤษฎี Random Walk กันมาบ้างแล้ว มันคือ ทฤษฎีที่บอกไว้ว่าตลาดหุ้นนั้นคาดการณ์ได้ยากเพราะมันเคลื่อนไหวอย่างค่อนข้างไร้รูปแบบ เพราะ ณ วินาทีใดเวลาหนึงๆนั้น ตลาดหุ้นได้มีตัวแปรหลายอย่างมากระทบ จนทำให้มันไม่สามารถคาดการณ์ได้ จนเปรียบเสมือนกับว่าการขึ้นลงของราคาหุ้นนั้นเกิดจากการเดาสุ่ม ในบทนี้เราจะมาดูกันว่า ตลาดหุ้นที่ว่าแรนด้อม จากสายตาของการจะสร้างโมเดลทำนายด้วย Machine Learning มอง Feature ผ่านการแรนด้อมนั้นอย่างไร?และจะส่งผลแบบไหนกัน?

04.png55.png

ก่อนอื่นลองของนิดหนึงนะครับ (รูปที่ 1) คือรูปราคาปิดของหุ้นตัวหนึงกับอีกตัวเป็นหุ้นที่ผมสังเคราะห์ขึ้นมาเองง? หรือว่า ทั้งสองคือกราฟราคาปิดของหุ้นทั้งคู่ล่ะ?
คำตอบ คือ อันล่างคือตอบที่ถูกต้อง มันคือดัชนี SET ตั้งแต่ปี มกราคม 2013 ถึงปี มีนาคม 2017 ส่วนอันด้านบนคือผลรวมของการแรนด้อมล้วนๆเป็นเวลา 1000 วัน แล้วเอามาบวกกันแบบสะสม จะเห็นว่ารูปแบบแทบแยกไม่ออกเลยทีเดียว ถือว่าเอามาให้ดูแยกกันเล่นๆกับตาเปล่านะ เดี๋ยวเราจะมาดูกันต่อไปว่ามันแรนด้อมยังไง

ถ้าเราว่าตาม Efficient Market Hypothesis ไม่ว่าตลาดจะเป็น Strong, Semi-Strong หรือ Weak Form ตลาดก็ต้องประกอบไปด้วยการ Random ของราคามันในระดับหนึงนะครับ โดยจะแรนด้อมน้อยหรือมากเท่านั้นเอง

Stock Market is Walking like a Drunkard

(รูปที่ 2)ผมได้ลองเอาดัชนี SET (รูปบนด้านล่าง)มาทำการหา Range of Change เพื่อให้เห็นกันชัดๆว่ามันแรนด้อมเหมือนคนเมายังไง 02ในรูปนี้ แกน X คือ วันที่ และ แกน Y คือ Rage of Change รายวันของ SET เป็น % ดูแรนด้อมมากกว่าเดิมเยอะใช่ไหมครับ แต่นี่หละถึงเราจะแรนด้อมมาทั้งหมด แต่เมื่อมาดูเป็น sequence แบบด้านบน(กราฟราคาปิดของ SET)แล้ว มันก็เกิดมีเทรนขึ้นมาได้เหมือนกัน ถ้าเรายัง สร้างระบบโดย Over-fitting ไปช่วงเวลาหนึงแปลว่าเรากำลังทำระบบใดๆก็แล้วแต่เนี่ย ให้มันจำ sequence แบบนี้ โดยไม่ได้ทำให้มันเหมาะสมกับข้อมูลใหม่ที่เข้ามามันก็พังครับ

Comparison Feature of other data to Feature of stock

การที่เราจะมานั่งทำระบบเทรดเราต้องเข้าใจก่อนว่า “เรากำลังเจอกับอะไร?” เคยใช่ไหมครับเมื่อนั่งทดลองระบบกันแล้วระบบกลับใช้งานได้ดีแค่บางช่วงเวลาที่เราทำการเทส แต่พอเวลาผ่านไประบบมันทำผลงานได้ย่ำแย่ลงมากซึ่งนั่นอาจจะมาจากเราทำการ Over-fitting ดังที่ได้นำเสนอไปในโพสก่อนหน้า แต่เราไป Over-fitting บนอะไรล่ะ? ถ้าเป็นข้อมูลที่แปรผันตามกันอยู่แล้วเช่น ข้อมูล น้ำหนัก-ส่วนสูงของนักบาส NBA (รูปที่3)01.png
โดยแกน X คือ น้ำหนักเป็นกิโลกรัม และ แกน Y ส่วนสูงเป็นเซ็นติเมตร จะเห็นว่าข้อมูลมันมีการแปรผันตามกันอยู่แล้ว สมมุติเราต้องการเอาน้ำหนักมาเป็น Feature ไปทำนายส่วนสูง Target ถ้าเรา Over-fitting ไป แน่นอนโมเดลเราจะแย่ในการให้การทำนายกว่าโมเดลที่ไม่ Over-fitting
แต่มันก็จะไม่แย่นักเมื่อเทียบกับการที่เราไป Over-fitting ข้อมูลหุ้น คือ ข้อมูลน้ำหนักโดยภาพรวมมันก็ยังบอกได้ว่ายิ่งน้ำหนักมากขึ้นมีผลต่อส่วนสูงที่เพิ่มขึ้นอยู่ดีแม้มันจะถูกต้องน้อยลง แต่กลับข้อมูลหุ้นกลับไม่ใช่แบบนั้นเพราะ Feature มันไม่มีที่จะเป็นตัวนำตัวตามแปรผันกันได้ง่ายๆเหมือนข้อมูลทางด้านอื่น

04.png

(รูปที่ 4) ผมใช้ Indicatorตัวหนึงลองมาทำนายราคาดัชนี SET วันถัดไป(จากนี้ขอเรียกมันเป็นคำศัพท์เฉพาะว่า Feature นะครับ)แกน X คือ Rage of Change รายวันของ SET เป็น % และ แกน Y คือ Rage of Change รายวันของ Indicator เป็น % โดยเราจะใช้ข้อมูลตั้งแต่ 2006 ถึง 2017 จะเห็นว่าต่างกับ น้ำหนักส่วนสูงมากใช่ไหมครับ มันแทบจะไม่มีเทรน หรือไม่มีความเกี่ยวข้องกันเลย ไม่ว่าFeature ตัวนี้จะเพิ่มขึ้น หรือลดลงเป็นจำนวนเท่าไหร่ ก็ไม่ได้ส่งผลอย่างชัดเจนของราคาดัชนี SET เลยว่าจะขึ้นหรือลงในวันต่อมา ไม่ว่า Feature จะมีการเปลี่ยนแปลงเป็นการบวกขึ้นมากแค่ไหน โอกาสที่ดัชนี SET มันก็ยังไปได้ทั้งสองทางอยู่ดี นี่แหละความลำบากของการทำโมเดล อันที่จริงๆหลายๆอินดิเคเตอร์ก็ไม่ได้แรนด้อมขนาด 50% หรอก บาง Feature มันก็อาจจะมีค่าหนีจาก Random คือมากกว่า 50% อยุ่นิดหน่อยก็มีครับ

แล้วการเพิ่ม Indicator เป็นเงื่อนไขร่วมล่ะมันคืออะไร  มันก็เป็นการพล๊อตแบบนี้ร่วมกันหลายๆข้อมูลนั้นเอง จากนั้นเราก็พยามหากฎจากมันว่า ถ้าค่า Indicator A เท่านี้ B เท่านั้น C มากกว่านี้จะส่งผลอย่างไรกับหุ้นนั้นๆ แต่ก็นั่นแหละ มันก็คือการยิ่งเพิ่มโอกาสในการ Over-fitting ข้อมูลนั่นเอง

เพราะฉะนั้นนี่แหละครับ สนามต่อสู้ที่เรากำลังเจออยู่ การหา Feature ที่ส่งผลอย่างมี Significant นั้นมีความหมายมาก ไม่แพ้โมเดลที่ซับซ้อนซะอีก อย่างผมเคยรันโมเดลที่ซับซ้อนอย่าง Deep Learning (เชิงทำนาย)กับ Feature ธรรมดาๆ ผมที่ได้มันก็ดีขึ้นแต่มันไม่ได้ดีขนาดนั้นหรอกนะครับ ตราบที่เรายังไม่มี Feature ที่มี Significant จริงๆ

Efficient Market Hypothesis ได้แสดงสมมุติฐานให้เห็นว่า ตลาดหุ้นอาจจะมีประสิทธิภาพกว่าที่เห็น การที่ตลาดหุ้นจะมีประสิทธิภาพได้นั้นย่อมแปลว่าตลาดหุ้นได้ดำเนินรอยตาม Random Walk Theory จะมากหรือน้อยก็นั่นแหละ โพสหน้าเรื่อง Random เราจะมาลองพิสูจน์

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s