Training size optimisation

 

การที่ Machine Learning จะทำงานได้เป็นอย่างดีนั้น มีพารามิเตอร์เข้ามาเกี่ยวข้องมากมาย ดังนั้น การใช้โมเดล ML ให้ได้ดี จึงไม่ใช่เพียง การมีโมเดลสำเร็จรูป โยนข้อมูลเข้าไป รอรับผลการทำนาย แล้วจบกัน การจะเลือกใช้โมเดล อย่างน้อยๆ ก็ควรจะรู้ การทำงานของมัน จะได้มีความรู้ความเข้าใจว่า เราจะสอนโมเดลนี้ให้ทำได้อย่างมีประสิทธิภาพได้อย่างไร เราต้องไม่ลืมว่า รูปแบบการสอนโมเดลที่ต่างกัน ผลลัพธ์ที่ได้อาจจะต่างกันได้อย่างไม่น่าเชื่อเช่นกัน

ขอยกตัวอย่าง ปัญหาแรกที่ ML จะต้องเจอก็คือ Training size
ยกตัวอย่างก็คงเหมือน Technical indicator หลายๆ ตัว ที่จะต้องคิดว่า จะมองย้อนกลับไปเป็นเวลานานแค่ไหนดี จึงจะได้ผลลัพธ์ที่ดีพอที่เราจะกำหนดช่วงของมันเพื่อทดลองต่อไปได้ เช่น
RSI ทำไมเราต้องใช้ค่าของ 14 วันกันล่ะ?
MACD ทำไมต้อง 9 12 26 หนอ?
คำตอบอาจจะเพราะผู้ที่คิดค้นมันขึ้นมาเขาอาจจะทดลองมาแล้ว ว่าทำไมมันถึงดี RSI เค้าอาจจะหมายถึงเวลาเทรด commodities 2 สัปดาห์จึงเอาค่านี้มาใช้
MACD นั้นก็อาจจะทดลองมากัยสินค้า”ของเขา” มาแล้วว่าทำงานได้ดี เขาจึงนำมาใช้กัน
แต่เราต้องไม่ลืมว่าเรื่องพวกนี้เนี่ย มันหลายปีมาแล้ว เรายังจะทำตามเลยนี่ก็ไม่ถูกเสียทีเดียว

ในเรื่องของ ML ก็เหมือนกัน การทำโมเดลจะทำการทำนายได้ดี เราจะต้องเรียนรู้ ธรรมชาติของโมเดลแต่ละตัวว่าต้องใช้ข้อมูลในการสอนโมเดลมันให้เรียนรู้เป็นจำนวนมากน้อยกว่ากันแค่ไหน อยู่ๆ จะมาเลือก 80 วัน 90 วันเลย ในฐานนะนักวิจัย เราก็คงจะไม่ทำแบบนั้นแน่ๆ เพราะมันไม่เป็นวิทยาศาสตร์ ทุกค่าที่จะกำหนด หรือ Tuning ML model ต้องผ่านการทดลองเพื่อ Optimise ก่อนเสมอ โดยที่เอามาโชว์นี่เป็นผลทางด้าน profit ก็จริง แต่ในการทดลองเพื่อ develop ระบบขึ้นมาจริงๆเราก็คงไม่มองแค่นี้แน่ๆ เราต้องพิจรณาค่าปัจจัยความเสี่ยงอื่นๆเป็นตัวแปรควบคู่กันไปด้วย อย่างที่ได้พูดกันไปก่อนหน้านี่บ้างแล้ว อันที่จริงจริงถ้าเรามี เป้าประสงค์แตกต่างกันไป เราก็ต้องคิดตัววัดอื่นๆขึ้นมาเพื่อความเหมาะสมกับเป้าประสงค์นั้น เราเองก็ใช้บางโมเดลที่ Optimise วันในการสอนมันโดยไม่จำเป็นต้องสนเรื่อง profit หรือ risk แต่ก็นั่นแหละ โมเดลนั้นๆต้องถูกออกแบบมาให้เหมาะกับการหาเช่นนั้นด้วย

รูปตัวอย่าง การตอบสนองต่อค่า Training size ต่างๆ ของ 10 โมเดลพื้นฐาน ML ทำนายผล (Classification + Regression) จากการรันไม่ต่ำกว่า 10,000 รอบ ในตัวอย่างขอยกซัก 2 ตัวก่อนแล้วกันเพราะในการทดลองจริงๆเราต้องทำเยอะมากคงลงหมดไม่ไหวนะครับ

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s