Linear Regression for Stock Market Analysis

วันนี้เราจะมาลองนำเทคนิค Linear Regression ที่เราเคยนำเสนอไปแล้วถ้าจำไม่ได้กดดูได้ที่ Linear Regression  มาดูกันว่าเราจะนำความรู้นั้นมาปรับใช้กับการวิเคราะห์หุ้น(หรือหลักทรัพย์ต่างๆ) อย่างไรบ้างในแบบเบื้องต้นนะครับ

พูดง่ายๆก็คือเราจะมาทำการหาความสัมพันธ์เชิงเส้นของสินทรัพย์สองตัว ตัวอย่างเช่น ตัวเลขการลงทุนด้าน Reserch ของบริษัทหนึงมีผลต่อผลการดำเนินการต่อบริษัทนั้นๆอย่างไร คำถามประเภทนี้เราสามารถใช้ความสัมพันธุ์เชิงเส้นมาอธิบายมันได้ครับ โดยผมจะใช้เป็นหุ้น PTT(ปตท.) ต่อ SET Index(ดัชนีตลาดหลักทรัพย์ไทย) ครับ

โดยเราจะใช้ ข้อมูลตั้งแต่ ต้นปี 2016 ไปจนถึง 2017 เดือน กุมภาพันธ์  เป็นจำนวน 286 วันทำการ ผลที่ได้คือ

01.png

จากรูปเราจะเห็นเชิงเส้นของ PTT ต่อ SET Index แกน X คือค่า Daily Return ของ SET รายวัน แกน Y คือค่า Daily Return ของ PTT รายวัน โดยที่เส้นสีแดงคือ เส้นที่ใช้อธิบายความสัมพันธ์ของหลักทรัพย์ทั้งสอง เราจะตีความอย่างไร เส้นตรงนี้ชี้เอียงไปทางขวาเค้าเรียกว่าแปลผันตามกันครับ โดยถ้าเรามองจากแกนของมันจะเห็นว่า ณ วันที่ SET ตลาดขึ้นหุ้น PTT มีโอกาสจะขึ้นตามกันมากกว่าลง ขณะที่ ถ้า SET ลง ก็มีโอกาสที่หุ้น PTT จะลงตามกันช่นกันแต่จากสเกลคือ ไม่ว่าจะขึ้นหรือลง ณ วันนั้นๆ หุ้น PTT จะมีโอกาสขยับมากกว่าตลาดหลักทรัพย์เกือบจะตลอดนั่นเอง

02

ตารางสรุป Stat สำหรับ Regression มันค่อนข้างเยอะแต่เราดูจริงๆไม่เยอะนักหรอกครับ ในที่นี้ก็ดู (Prob)F-Statistic กับ Coef ไว้ก็พอแล้ว

  • (Prob)F-Statistic ก็คือ P-value สำหรับ Linear ดีๆนี่แหละครับ prob เพื่อเทสสมมุติฐานนั่นเอง P-value ก็คือค่าที่ปฎิเสธสมมุติฐานของเราในการเทสนั้นๆ เราจึงคาดหวังให้ค่ามันเล็กมากจนถึงระดับหนึง (ตำราว่า > 0.05 แต่มันก็ไม่จริงเสมอไปหรอกครับ มันขึ้นกับงานที่เราจะเทสด้วย Threshold มันเลยต่างกัน) สรุปเจ้าค่า F-statistic น้อยก็จะแปลว่า Linear Regression นี้สามารถอธิบายความสัมพันธ์ของมันได้ดีนั่นเอง ในที่นี้ ค่าของมันเล็กมากๆ 0 นำหน้า 89 สี่สิบกว่าตัว!!! เล็กกว่าตำรามาก เรื่องนี้ไม่มีปัญญาข้อมูลสองชุดนี้สามารถอธิบายความสัมพันธ์ซึ่งกันและกันกันได้แน่นอน
  • Coef(Coefficient) บอกว่า x1 มีค่าเท่ากัย 1.599 นั่นสามารถแปลความหมายได้ว่า ในการขึ้นหรือลงตามกันของทั้ง PTT และ SET นั้น เราสามารถคาดหวังได้ว่า PTT จะเคลื่อนไหวตาม SET แต่จะเคลื่อนไหวมากกว่าเป็นจำนวน 1.599 เท่า นั่นเองเราจะเห็นว่า PTT มี Volatility สูงกว่า SET อีกด้วยครับ

ในการเทรดนี่เราคงไม่มองแค่กำไรเยอะคือดีนะครับ ในทางที่ดีคือถ้าเราเทรด PTT ได้ผลเราคงได้เงินเยอะกว่าไปเทรดบน SET ก็จริง แต่ในทางกลับกันเราก็จะเพิ่มความเสี่ยงไปด้วย ฉะนั้นต่อไปเราจะมาพยายามลดความเสี่ยงตรงนี้นะครับ ในบทความต่อๆไปนู้นเลย เพราะมันมีหลายวิธีหลายแบบมากก แม้แต่ตัวผู้เขียนก็ไม่ได้รู้หมดครับ ก็ค่อยๆมาเรียนกันไปนะครับ

เอาละครับได้ดู ปตท. ไปแล้วจะเห็นว่าหุ้นตัวนี้มีความเหวี่ยงมากกว่าตลาดถึง 1.6 เท่าเลยทีเดียว  เดี๋ยวเราเอามาดูกันอีกซักหน่อยนะครับว่าตัวอื่นเป็นไงมั่ง คราวนี้ผมเลือกใช้หุ้นธนาคารทหารไทย TMB  ส่วนเรื่องเวลาเราใช้เหมือนกันกับด้านบนนะครับ เรามาดูผลกันดีกว่า

03

แกน X คือ Daily Return ของ SET ขณะที่ แกน Y คือ Daily Return ของ TMB รูปนี้จากตาคร่าวๆมันก็แปรผันตามกันอีกแล้วนะครับเดี๋ยวมาดู Statistic ของมันหน่อย

04

  • (Prob)F-Statistic เล็กมากเช่นเดิม อันนี้ก็ไม่มีปัญหา
  • Coef(Coefficient) อันนี้แตกต่างกับ PTT อยุ่นะครับ โดยค่ามันแค่ 1.13 แปลว่าเจ้าหุ้น TMB เนี่ยมันเคลื่อนไหวมากกว่า SET โดยเฉลี่ยแค่ 1.13 เท่า เท่านั้น หุ้นตัวนี้ Volatility ไม่มากนักเมื่อเทียบกับตลาด

ก่อนจะจบผมอยากจะให้มาดูหุ้นตัวที่อธิบายความสัมพันธ์กันและกันไม่ได้กันบ้างครับ โดยผมจะใช้หุ้นในช่วงเวลาเดิมครับ แต่ผมจะใช้ หุ้นที่ฟังดูแล้วคงไม่เกี่ยวข้องกันมาลองแล้วกัน คือหุ้นบริษัทเพลงอาร์เอส RS และ หุ้นบริษัทยางพาราศรีตรัง  STA มาดูกันครับ

05

แกน X คือ Daily Return ของ STA ขณะที่ แกน Y คือ Daily Return ของ RS จากรูปก็เริ่มจะดูไม่ดีแล้วนะครับ Linear Regression ก็บอกว่าพอจะสัมพันธ์กันนะแต่ด้วยความชันที่น้อยมาก จากตาก็ไม่พอมาดู Statistic กันอีก

07

  • แค่ (Prob)F-Statistic ใหญ่โตเลยครับ 0.142 มากกว่า 0.05 ไม่น้อยดลย มันบอกเราว่าไอ้เส้นแดงนี้ชักจะอธิบายความสัมพันธ์ของหุ้นสองตัวนี้ไม่ค่อยจะได้แล้วสิแสดงว่าหุ้นสองตัวนี้แทยจะไม่มีความสัมพันธ์ต่อกันเลย

อย่างที่เคยพูดมานั่นแหละครับ เราทำงานสายนี้คือการเล่นกับ ดาต้า จากดาต้าดิบๆ ค่อยๆขุดค้นขัดเกลามันจนมีความหมายขึ้นมา ให้มันมีประโยชน์ขึ้นมาทีละน้อยๆ จากที่เราเล่นกับดาต้าวันนี้เราคงจะสรุปได้ดังนี้

  • หุ้นทั้งสองตัวนี้มันมีค่า Beta กับตลาดหลักทรัพย์อยู่ คือแปรผันตามกันซะส่วนใหญ่
  • หุ้นทั้งสองตัวนี่มันมีระดับ Volatility ต่างกัน อย่างที่เรารู้ว่า Volatility สูงมันก็แปลว่าอาจจะทำได้มี Return หรือ Loss มากกว่าตัวที่ Volatility ต่ำก็ได้ แต่เราก็ต้องรู้ว่าการสร้างระบบเทรดที่ดี เราไม่ควรคาดหวังให้ระบบมี Volatility ที่สูงเกินไปนัก ดังนั้นตรงจุดนี้เราต้องหาทางลด Volatility ลง
  • ไม่ใช่ว่าเราจะต้องหลีกเลี่ยงหุ้นที่มี Volatility สูงซะทีเดียวครับ ยังมีระบบบางรูปแบบที่หากินกับ Volatility เหมือนกัน ฉะนั้นคงสรุปได้ว่าเราก็เอาตรงนี้มาช่วยคัดกรองหุ้นให้เข้ากับระบบเราก็ได้เช่นกัน เช่นระบบที่ชอบ Volatility ก็ให้ลงทุนในหุ้นที่มี Volatility สูง ส่วนระบบที่ไม่ชอบหุ้นมี Volatility ก็ต้องใช้ตัวที่มี Volatility ต่ำมาใน pool นั่นเอง
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s