ค่า Correlation กับการลงทุน

เราจะมาหาคำตอบกันว่าค่า “Correlation” หรือ ที่บางครั้งอาจจะเรียกกันว่า  Cross-Correlation  นี้คือค่าอะไร ? และ จะสามารถนำมาใช้ประโยชน์ในการเทรดได้มากน้อยแค่ไหน?

Correlation คือค่าอะไร?

“Correlation” เป็นอีกค่าพื้นฐานที่มีความพิเศษ และ มีประโยชน์เป็นอย่างมากในการเทรด เนื่องจาก เป็นค่าที่สามารถบอก ความสัมพันธ์ของข้อมูล” ซึ่งแน่นอนว่าความสัมพันธ์นี้จะสามารถนำไปสู่การทำนายข้อมูลในอนาคตได้นั่นเอง

ดังนั้น การทำความเข้าใจ Correlation จะเป็นประโยชน์อย่างมากในกับงานด้าน Quantitative Analysis สำคัญถึงขนาดที่ว่า Investing back ยักษ์ใหญ่อย่าง Goldmad Sachs  หยิบยกมาใช้ถามผู้สมัครในการคัดเลือก Quants กันเลยทีเดียว! เพราะฉนั้น เราคงจะวิ่งหนีค่าพื้นฐานค่านี้ ไม่ได้จริงๆ มาเรียนรู้กันดีกว่า ว่ามันคืออะไร และ จะสามารถนำไปใช้ช่วยในการเทรดได้อย่างไร

ค่า Correlation กล่าวอย่างง่ายๆ ก็คือ ค่าที่บอกว่า ข้อมูล 2 ชุด นั้น correlate (มีความสัมพันธ์กัน) กัน หรือไม่ อย่างไร ถ้าข้อมูล 2 ชุด มีความสัมพันธ์กันสูง ก็จะเรียกได้ว่าเป็นข้อมูลที่ “High-correlated” ในทางกลับกัน ถ้าข้อมูลนั้นมีความสัมพันธ์กันต่ำ ข้อมูลนั้นก็เป็นข้อมูลที่ “Low-correlated” เพื่อให้เห็นภาพมากขึ้น เราลองมาดูตัวอย่างข้อมูล และ ค่า Correlaion กัน

ตัวอย่าง 1 : High-Correlated (Positive) 

เราจะลองสร้างข้อมูลแบบสุ่มที่ขึ้นมา 2 ชุด คือ  X และ Y ชุดละ 50  ค่า โดยที่
X => ค่าข้อมูลสุ่ม ระหว่าง [0-1]
Y => ค่าข้อมูล X บวกด้วยค่า noise ที่มีการแจกแจงปกติ เข้าไป

แน่นอนว่า ข้อมูลสองชุดนี้จะต้อง มีความสัมพันธ์กัน คือข้อมูล Y ได้มาจากข้อมูล X บวกค่าสุ่มอีกเล็กน้อย ตามที่กล่าวมาแล้ว มาลองพล็อตกราฟดูลักษณะข้อมูลกัน

screen-shot-2016-10-26-at-02-04-33

จาก line graph (A) และ Scatter plot (B) จะเห็นได้ค่อนข้างชัดเจนว่า ข้อมูล 2  ชุด คือ X และ Y ของเรานั้นมีลักษณะของความสัมพันธ์กันสูง รูป (A) กราฟของ X และ Y จะขยับไปในทิศทางเดียวกัน ขึ้นและลงพร้อมๆ กันเป็นส่วนใหญ่ และเมื่อดูใน รูป (B) ก็ยิ่งยืนยันได้อีกว่า X กับ Y มีความเกี่ยวข้องกัน คือ ถ้าค่า X เพิ่ม Y ก็จะเพิ่มไปมากกว่า X อยู่เล็กน้อย เช่นตัวอย่าง ที่วงกลมไว้ ถ้า X = 0.4 แล้ว Y ก็จะมีค่ามากกว่า X อยู่เล็กน้อย ในที่นี่ก็คือ 0.7

มาลองดูค่า Correlation ระหว่างข้อมูล X และ  Y  กันค่ะ ว่า ข้อมูลนั้นมีความสัมพันธ์กันจริงตามที่เราคิดหรือไม่ Correlation matrix ที่ได้จากการคำนวณ เป็นดังนี้

screen-shot-2016-10-26-at-01-20-02

จะเห็นว่า ค่า Correlation ในแนวแทยง จะมีค่าเป็น 1 ซึ่งหมายความว่าข้อมูลสัมพันธ์กันอย่างมาก เรียกว่าเคลื่อนไหวขึ้น และ ลงด้วยกันตลอดเวลา ซึ่งก็แน่นอนเพราะ มันเป็นค่า Correlation ระหว่างข้อมูลชุดเดียวกัน คือ ระหว่าง X-X กับ Y-Y … เลื่อนมาดูค่าที่เราสนใจกัน คือค่า Correlation ระหว่าง X-Y หรือ Y-X ซึ่งมีค่าเท่ากันคือ 0.98677268 เกือบๆ จะเท่ากับ 1 ซึ่งยืนยันข้อสังเกตุของเราก็คือ ข้อมูล X และ Y  เป็นข้อมูลที่ High-correlated กัน เคลื่อนไหวไปในทิศทางเดียวกันเป็นส่วนใหญ่

ตัวอย่าง 2 : Low-Correlated

ได้ดูตัวอย่าง ข้อมูลที่ High-correlated กันไปแล้ว มาดูตัวอย่างที่เป็น low-correlated กันบ้างดีกว่า รอบนี้จะสร้างข้อมูล X และ Y ขึ้นชุดละ 50 ค่า แต่จะสร้างโดยการสุ่มระหว่าง [0-1] โดยจะเป็นการสุ่มแยกกันไปเลย ดังนี้

7_5and6

จากรูปจะเห็นค่อนข้างชัดเจนนะคะ ว่าข้อมูลชุด X และ Y ไม่ได้เคลื่อนไหวไปในทิศทางเดียวกันเหมือนกับตัวอย่างก่อนหน้าอีกแล้ว โดยเฉพาะรูป B จะเห็นเลยว่า ข้อมูลมีความกระจัดกระจายมากๆ ไม่สามารถหาเส้นตรง หรือ แม้แต่เส้นโค้งในรูปแบบพื้นฐานมา Fit กับข้อมูลได้เลย มาดูกันดีกว่าค่ะว่า ข้อมูลแบบนี้ ค่า Correlation จะเป็น ยังไง?

screen-shot-2016-10-26-at-01-23-04

เป็นอย่างที่คิดไว้จริงๆ ว่า Correlation ของข้อมูลชุดนี้ต่ำมาก เพียงแค่ 0.10471794 เท่านั้น แสดงว่าข้อมูลสองชุดนี้ มีความสัมพันธ์กันต่ำมากๆ เคลื่อนไหวอิสระ ไม่ขึ้นต่อกัน

ตัวอย่าง 3 : High-Correlated (Negative) 

จากสองตัวอย่างที่ผ่านมา ก็จะได้เห็นแล้วว่า ค่า Correltion สูงๆ คือ ข้อมูลส่วนใหญ่เคลื่อนไหวไปในทางเดียวกัน ค่า Correlation ต่ำๆ คือ ข้อมูลไม่สัมพันธ์กัน ในตัวอย่างนี้ เราจะมาดูกันในอีกกรณีนึงคือ กรณีข้อมูลเคลื่อนไหวแบบมีความสัมพันธ์กัน แต่เป็นความสัมพันธ์ที่ “ตรงกันข้าม” มาดูข้อมูล X และ Y กรณีนี้กันค่ะ

11_9and10

กรณีนี้ ค่าของ X และ Y มีการเคลื่อนที่ในทางตรงกันข้ามกัน ซึ่งในทางคณิตศาสตร์ ถือว่ายังเป็นข้อมูลที่มีความสัมพันธ์กันแบบมีนัยสำคัญนะคะ ถึงแม้ว่าจะเป็นความสัมพันธ์ในทางตรงกันข้าม หรือ ความสัมพันธ์เชิงลบ  (negative correlation) ก็ตาม ซึ่งก็จะเห็นได้ชัดเจนจาก กราฟในรูป B จุดข้อมูลมีแนวโน้มไปในทางเดียวกัน และ มีความเป็นไปได้ที่จะ Fit  เส้นตรง หรือ เส้นโค้ง เข้ากับข้อมูลค่อนข้างดี ค่า Correlation ของข้อมูลในลักษณะนี้ จะเป็นค่าติดลบ ซึ่งค่าของข้อมูลชุดนี้ คือ -0.84142536 

จากตัวอย่างทั้งหมด ขอสรุปง่ายๆ ว่าค่า Correlation เป็นค่าที่แสดงว่าข้อมูล 2  ชุดใดๆ มีความสัมพันธ์กันแค่ไหน อย่างไร โดยค่านี้จะมีช่วงค่าอยู่ที่ [-1, 1] และ สามารถแบ่งออกได้เป็น 3 กลุ่ม ดังนี้

  •  (Positive) strong correlation : ข้อมูล 2 ชุด มีความสัมพันธ์กันสูง และเป็นความสัมพันธ์ไปในทางเดียวกัน ข้อมูลเคลื่อนไหวไปในทิศทางเดียวกัน ค่า  Correlation ก็จะสูง ยิ่งเข้าใกล้ค่า 1 ก็ยิ่งมีความสัมพันธ์ที่สูงมากขึ้น (แน่นอนถ้าข้อมูลเดียวกันค่า  Correlation ก็จะมีค่าสูงที่สุด คือ 1 นั่นเอง)

  • (Negative) strong correlation : ข้อมูล 2 ชุด มีความสัมพันธ์กันสูง แต่เป็นความสัมพันธ์ในทางตรงกันข้าม ซึ่งก็คือ ถ้าข้อมูลชุดหนึ่งมีการเพิ่มค่า ข้อมูลอีกชุดก็จะต้องมีการลดค่า ค่า Correlation ของข้อมูลกลุ่มนี้ก็จะมีค่าเป็น ลบ ที่เข้าใกล้ -1 นั่นเอง

  •  Weak correlation : ข้อมูล 2 ชุด มีความสัมพันธ์กันต่ำ หาความสัมพันธ์กันแทบจะไม่ได้ ค่า  Correlation ก็จะมีค่าเข้าใกล้ 0 (ถ้าข้อมูลไม่มีความสัมพันธ์ใดๆ ต่อกันเลย ค่า Correlation จะเท่ากับ 0)

screen-shot-2016-10-26-at-01-30-10

จะนำ Correlation มาช่วยกันในเทรดได้มั้ย ?

อย่างที่บอกไปข้างต้นแล้วว่า ค่า Correlation เป็นค่าเล็กๆ ที่ประโยชน์ไม่เล็กตามเลย แน่นอนว่ามันต้องมีแนวโน้มที่จะทำมาใช้ในการเทรดได้สูง ไม่อย่างนั้นแล้วธนาคารยักษ์ใหญ่ด้านการลงทุน Goldmad Sachs คงไม่หยิบยกมาเป็นคำถามในการคัดเลือกพนักงานหรอก จริงมั้ยคะ?

เรื่องการทำไปใช้ เป็นเรื่องที่ขั้นอยู่กับเทคนิคของแต่ละคนจริงๆ คงจะชี้ชัดออกไปได้ยากว่าควรจะนำไปใช้ด้วยวิธีไหนดี เอาเป็นว่า ขอเล่าให้ฟังแล้วกันค่ะ เมื่อต้นปีที่ผ่านมาได้มีโอกาสอ่านงานวิจัยชิ้นหนึ่งของนักศึกษาจาก มหาวิทยาลัย Standford ประเทศ USA เท่าที่จำได้ (อาจจะจำในรายละเอียดไม่ได้หมดนะคะ เพราะอ่านนานมากแล้ว) งานวิจัยเป็นงานวิจัยง่ายๆ ทำขึ้นเพื่อเป็นผลงานในชั้นเรียนวิชา Machine Learning เพราะฉะนั้นจะอ่านง่าย ไม่ซับซ้อนเลย

หลักการพื้นฐานง่ายๆ เลยของงานวิจัยชิ้นนี้ก็ ถ้าเรารู้ว่าหุ้นสองตัวนี้มีค่า Correlation สูง แสดงว่ามันก็มีแนวโน้มจะมีการเคลื่อนไหวไปในทิศทางเดียวกันน่ะสิ ดังนั้น เราจะลงทุนหุ้นตัวหนึ่ง โดยการวิเคราะห์ทิศทางของหุ้นอีกตัวที่เปิดตลาดมาก่อน!

งานวิจัยชิ้นนี้ นักศึกษาได้ศึกษาความสัมพันธ์ระหว่างหุ้นหลายๆ ตัว เพื่อค้นหาหุ้น ที่มีการเคลื่อนไหวไปในทิศทางเดียวกัน (ค่า Correlation สูง) แล้ว หยิบเอาหุ้น ตัวนึง มาเป็นตัวนำ เพื่อใช้ในการตัดสินใจซื้อขายหุ้นอีกตัว โดยใช้ข้อได้เปรียบของโซนเวลา (Time Zone) เข้ามาช่วย … ยกตัวอย่างเช่น ถ้าเราค้นพบว่า หุ้น A จากตลาดเอเชีย มีค่า Correlation ที่สูงมาก กับหุ้น B จากตลาดยุโรป … สมมุตฐานก็คือ หุ้นสองตัวนี้ ในอดตีมักมีการเคลื่อนไหวไปในทิศทางเดียวกัน! และ เนื่องจาก หุ้นจะ A เปิดตลาดก่อนหุ้น B เสมือ เราก็จะใช้ความได้เปรียบเรื่องเวลา แล้วตัดสินใจซื้อ หรือ ขายหุ้น B ตามหุ้น A นั่นเอง 

ที่เล่ามา เป็นเพียงแค่ไอเดียคร่าวๆ จากนักศึกษานะคะ รายละเอียดจริงๆ ยังมีอีกมาก ใครสนใจลองตามดูได้ ตามงานวิจัยนี้เลยค่ะ  …

screen-shot-2016-10-26-at-01-57-30

(นอกจากงานวิจัยนี้แล้ว ยังมีงานวิจัยอีกมากกกกกมาย ที่มีการประยุกต์ใช้ค่า Correlation ในการลงทุน ใครสนใจลองค้นหาดูกันนะคะ หรือ ถ้าต้องการให้ส่งไฟล์ให้ ก็สามารถติดต่อมาได้เลยนะคะ)

นอกจากงานวิจัยแล้ว ในโลกของนักลงทุน ถ้าจะให้พูดถึงนักลงทุนที่นำ Correlation ไปวิเคราะห์ในการลงทุนที่ดังๆ ก็จะมี คนนี้ค่ะ  คุณ  “James Harris Simons”  ศาสตราจารย์นักคณิตศาสตร์ สัญชาติอเมริกันชื่อดัง ที่ผันตัวมาเป็นนักลงทุน ผู้ก่อตั้ง และ CEO “Renaissance Technologies” หนึ่งใน  Hedge fund ที่ประสบความสำเร็จสูงสุดบริษัทหนึ่ง ที่มีทรัพย์สินโดยประมาณ  $16.5 billion (September 2016). ใครสนใจลองไปหาบทสมภาษณ์ฟังกันได้นะคะ ตัวผู้เขียนได้เคยฟังบทสัมภาษณ์ตอนนี้คุณ  James ได้พูดถึง Correlation ไว้หลายครั้ง แต่เสียดายไม่ได้เก็บเอาไว้ ใครสนใจไปลองหาอ่านกันได้นะคะ ขอลงตัวอย่างไว้ซักหน่อยละกันค่ะ ลองฟังดูกันค่ะ ….

 

 

Advertisements

One thought on “ค่า Correlation กับการลงทุน

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s