Math 101 : Variancec และ Standard Deviation

ถ้าจะกล่างถึงว่าอะไรเป็นสิ่งที่สำคัญที่สุดในการวิเคราะห์หาระบบลงทุนซักระบบหนึง คำตอบคงไม่ใช่แค่ Return อย่างเดียวแน่นครับสำหรับชาว Quants เรา สิ่งที่สำคัญที่สุดคืออัตรา Return ต่อ Risk ต่างหาก หมาถึงเราต้องการกำไรที่ไม่ใช่ว่ามากที่สุด แต่เป็นกำไรระดับหนึงในระดับความเสี่ยงที่เรารับได้ วันนี้เราจะมารู้จักกับตัววัด Risk กันครับ

ถ้างั้น Risk คืออะไร วันนี้เรามาเริ่มกันตั้งแต่เบสิกที่สุดกันเลยครับ ถ้ามีระบบลงทุน สองระบบ ได้ผลตอบแทนเฉลี่ยเท่ากันที่ 20% ต่อปี เราควรจะเลือกระบบไหน เพราะอะไร

ระบบ A

  • ปีที่ 1 21%
  • ปีที่ 2 19%
  • ปีที่ 3 22%
  • ปีที่ 4 18%
  • ปีที่ 5 20%

ระบบ B

  • ปีที่ 1 55%
  • ปีที่ 2 -15%
  • ปีที่ 3 -25%
  • ปีที่ 4 55%
  • ปีที่ 5 30%

ทั้งสองระบบนี้ต่างได้ค่าเฉลี่ยเท่ากัน คือ 20%(ขอยกตัวอย่างเป็น Simple return เพื่อให้เห็ยภาพง่ายๆก่อนนะครับ) แต่มีความแตกต่างชัดเจนระหว่างสองระบบนี้ระบบ A จะ อยู่ในช่วง 18-22% ไม่ว่าจะปีไหนๆระบบแบบนี้ถือว่าค่อนข้างเสถียร ส่วนระบบ B เป็นไปได้ตั้งแต่ขาดทุนหนักถึง 25% หรือ กำไรมากมายแบบ 55% ถ้าเราเข้ามาลงทุนในปีที่ 2 ถึง 3 นี่ผลตอบแทนจะเห็นชัดเลยครับว่าระบบ B ขาดทุนยับ กว่าระบบ A แน่ๆ ถ้าเราลงทุนอยุ่ก็คงไม่อยากเห็นเงินลงทุนแกว่งขึ้นลงเหมือนเล่นรถไฟเหาะใช่ไหมครับ แล้วมีวิธีวัดอย่างเป็นหลักการอย่างไรบ้างมาดูกัน

Variance

ความแปรปรวนก็คือการวัดว่าข้อมูลนั้นแจกแจงออกห่างจากค่าเฉลี่ยของข้อมูลมากน้อยแค่ไหนตามสมการนี้

usual

ก็เป็นแค่การหาค่าผลรวมของการนำค่า X ซึ่งในที่นี้คือผลตอบแทนรายปี มาลบ u หรือ ค่าเฉลี่ยจากนั้นยกกำลัง 2 แล้วหารด้วย N ซึงก็คือจำนวนปี – 1 เท่านั้นเอง

กำลัง 2 ที่ยกไว้เนี่ยเพื่อให้ข้อมูลที่เป็นลบให้กลายเป็นบวกเพื่อเอามา Sum กันแล้วไม่หายไปนั่นแหละครับ คือถ้าเราไม่ยกกำลัง ความเบี่ยงเบนทางบวกและทางลบมันลบล้างกันเอง ด้วยเหตุผลง่ายๆดังนี้เราจึงยกกำลัง 2 ครับ

ก็จะได้เป็น

A = ((21-20)^2+(19-20)^2+(22-20)^2+(18-0.20)^2+(20-20)^2)/5-1

= (1 + 1 + 4 + 4 + 0)/4

= 10 /4

= 2.5

B = ((55-20)^2 + (-15-20)^2 +(-25-20)^2 + (55-20)^2 + (30-20)^2)/5-1

=  (1225 + 1225 + 2025 + 1225 + 100)/4

= 5800/4

= 1450

2.5 กับ 1450 ต่างกันใหญ่เลยใช่ไหมครับ

Standard Deviation

ส่วนเบี่ยงเบนมาตรฐาน คือตัววัดระดับความเอนเอียงของข้อมูลจากข้อมูล เนื่องจากคำถามที่ว่าข้อมูลนี่มันเหวี่ยงแค่ไหนจากข้อมูล ถ้ามีคำถามว่าระบบ B มันเหวี่ยงแค่ไหนกันนะ แล้วเราไปเอา Variance มาตอบก็คือ 1450 มันก็งงใช่ไหมครับ อะไรกับข้อมูลจาก -25 ถึง 55 จะเหวี่ยงเป็นพันได้ไง เพราะปัญหาจากด้านบนที่เรานำไปยกกำลังเพื่อจุดประสงค์ของ Variance แต่ก็นั่นแหละ ถ้าจะตอบคำถามว่ามันเบี่ยงแค่ไหนมันก็ไม่สื่อ เค้าเลยพัฒนา Standard Deviation ขึ้นมาเพื่อแก้ปัญหาข้างต้นครับ เนื่องจากข้างบนมันมีปัญหามาเพราะเรายกกำลัง 2 แก้กลับก็ง่ายๆครับ เอาค่าที่ได้มาใส่รูทกับเข้าไป มันก็แค่นั้นเลยนี่

stdev_s

ก็แค่ใส่รูทเข้าไปจากสมการเดิมเท่านั้นครับ

A = รูท 2.5 = 1.58

B = รูท 1450 = 38.57

แค่เนี้ย Math ก็เม้กเซ้นแล้วครับว่าหาไปทำไม และทำไปเพื่ออะไร รู้แค่นี้ก็พอจะคำนวนดูประสทิธิภาพของระบบคร่าวๆได้แล้วแต่มันก็ยังแค่เบี่ยงเบนไม่ได้คิดต่อกำไร ถ้าวัดแบบนี้เฉยๆ ถ้ากำไร ระบบ A น้อยกว่า ระบบ B มาก แต่ระบบ B ดันมี Standard Deviation สูงกว่าเราจะทำอย่างไรล่ะ ซึ่งต่อไปก็จะมีวิธีวัดเชิงกำไรต่อ Standard Deviation ก็คือ Sharpe Ratio ครับ

ก็สรุปได้ว่า ระบบ A มีระบบที่มีความเสถียรกว่าระบบ B เยอะ สิ่งเหล่านี้เป็นพื้นฐานที่เราต้องใช้บ่อยมากในการทำ Quants ครับ

อย่าคิดว่าพวกนี้ math เด็กๆนะครับ นี่คือพื้นฐาน 101 ต่อไปสิ่งพื้นฐานพวกนี้ จะต่อยอดไปยังการวัดผลอย่าง Sharpe Ratio ไปจนถึงสมการมนุษย์ทองคำ Black-Scholes มันก็มาจากสิ่งง่ายๆพวกนี้ครับ

เกร็ดเล็กๆ เราหลายคนอาจจะเคยสงสัยกันมาก่อนว่าทำไมคำนวนทางสถิติหลายๆอย่างเราต้องมาหารด้วย N-1 แทนที่จะเป็น N เฉยๆนะครับ จริงๆแล้วมันมีเหตุผลเพราะโอกาสในการสุ่ม Sample มาคำนวนแล้วเกิด Bias ครับ N-1 เค้าจะทำให้ค่าใหญ่กว่าปรกติเล็กน้อยเพื่อแก้ปัญหา Bias ครับ

why n-1?  ตามนี้เลยครับ

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s