Top 5 Basic Python Libraries แห่งปี 2017

ในบทความนี้ เราจะมาทัวร์ไลบารี่พื้นฐานของ Python ที่เป็นที่กำลังเป็นที่นิยมกันมากๆในปีนี้กันค่ะ ใครที่ใช้ Python  หรือ กำลังสนใจจะใช้ ก็อย่าลืมไป install มาใช้กันนะคะ รับรองเลยว่าจะทำให้การทำงานราบรื่น ง่ายดาย ขึ้นอีกมากกกกกก นี่ล่ะค่ะ อีกหนึ่งข้อดีของ Open source  และ ยิ่งเป็น Open source ที่กำลังได้รับความนิยมจากผู้ใช้ทั่วโลกแบบนี้ด้วยแล้ว การพัฒนาจะรวดเร็ว ก้าวไกล ยิ่งขึ้นไปอีก ทำให้ผู้ใช้งานอย่างเราได้รับผลประโยชน์ไปแบบเต็มๆ

มาดูกันดีกว่าค่ะ ว่าไลบรารี่พื้นฐานที่น่าเล่นของ  Python มีอะไรกันบ้าง

1. Numpy (Commits: 15908, Contributors: 522)

หนึ่งในไลบารี่พื้นฐานที่ผู้ใช้ Python 99% น่าจะต้องเคยผ่านตากันมา ก็คือ ไลบรารี่พื้นฐานในการจัดการทางคณิตศาสตร์ที่ทรงพลังอย่าง Numpy (ย่อมาจาก Numerical Python) ไลบรารี่นี้นับว่ามีประโยชน์มากๆ ในการจัดการ Array และ  Matrics ใน Python ซึ่งผู้ที่ได้ใช้งานกันมาแล้วจะทราบกันดีว่า Array และ Matrices มีประโยชน์ในการทำงาน และ ทำให้การจัดการคำนวณต่างๆ ง่าย และ สะดวก รวดเร็ว มากขึ้นมากๆ ซึ่งถือว่าเป็นจุดเด่นของ Numpy

1_numpy 

2. Pandas (Commits: 15089, Contributors: 762)

อีกหนึ่งไลบรารี่ที่สำคัญในการจัดการข้อมูลประเภทที่มี label (มีชื่อแถว ชื่อคอลัมน์) อยู่ในข้อมูลด้วย ไลบารี่นี้จะช่วยในการจัดการข้อมูลประเภทนี้ได้ดี ทำให้เราสามารถรักษาความสัมพันธ์ ความหมาย ของข้อมูลไว้ได้ อีกจุดเดนหนึ่งก็คือ ช่วยให้สามารถจัดการข้อมูล และแสดงผลข้อมูลได้ดียิ่งขึ้น Pandas  รูปแบบของข้อมูล หลักๆ อยู่ 2  รูป แบบคือ Series และ dataFrame โดยที่ Series จะเป็นข้อมูลลักษณะหนึ่งมิติ (ถ้าเป็นตารางก็มีเพียง 1 คอลัมน์) ส่วน DataFrame ก็เป็นข้อมูล 2 มิติ  (ตารางที่มีหลายคอลัมน์) ตัวอย่างเช่น ข้อมูลหุ้นที่โหลดเข้ามาใน Python ก็มักจะจัดเก็บในรูปแบบของ DataFrame ของ pandas นี่แหละค่ะ

2_pandas

3. Matplotlib (Commits: 21754, Contributors: 588)

Matplotlib อีกหนึ่งไลบารี่ที่เป็นที่นิยมมากๆ สำหรับการแสดงผลข้อมูล ซึ่งใน QuantML เราก็มีการใช้ library นี้ในการแสดงผลพื้นฐานอยู่เป็นประจำ หลายๆ ท่านอาจจะเคยเห็นกันมาแล้วในการพล็อตกราฟต่างๆ ของเรา Matplotlib library ได้มีการเตรียมรูปแบบกราฟที่น่าสนใจและเป็นประโยชน์ให้กับผู้ใช้มากมาย ยกตัวอย่างเช่น

  • กราฟเส้น (Line plots)
  • กราฟการกระจายของจุด (Scatter plots)
  • กราฟแท่ง และ ฮิสโตรแกรม (Bar charts and Histograms)
  • กราฟแผนภูมิวงกลม (Pie charts)
  • กราฟคอนทัวร์ (Contour plots)
  • กราฟสเปคตรัม (Spectrograms)

3_matplotlib

4. Seaborn (Commits: 1699, Contributors: 71)

Seaborn เป็นไลบรารี่ที่ถูกสร้างขึ้นบนพื้นฐานต่อจาก  Matplotlib ที่ต้องยอมรับจริงๆ ว่ามาแรงมากๆ ในการแสดงผลในลักษณะของการสรุปข้อมูล การแสดงผลการกระจายของข้อมูล ในพักหลังๆ นี้ทางกลุ่มเราก็ใช้กันเยอะ โดยเฉพาะในงานที่ต้องใช้ในการนำเสนอ เนื่องจาก  Seaborn ให้การแสดงผลที่ทรงพลัง สวยงาม น่าดึงดูดมาก อีกทั้ง ในส่วนของการแสดงการกระจายของข้อมูล Seaborn นั่น ทำได้ดี ไม่มีที่ติเลยทีเดียว

4_seaborn

5.Statsmodels (Commits: 8960, Contributors: 119)

ไลบรารี่นี้ดูจากชื่อแล้วก็คงจะพอเดากันได้นะคะว่าทำอะไร  Statsmodels เป็นไลบรารี่ที่ถูกพัฒนาขึ้นเพื่อการคำนวณทางสถิติโดยเฉพาะ เพียงแค่ใช้คำสั่งที่ได้ถูกเตรียมไว้คุณก็จะได้ค่าวิเคราะห์ทางสถิติที่จำเป็นทั้งหมดที่ถูกจัดเซ็ตมาอย่างดี สามารถใช้ร่วมกับ Algorithm ต่างๆ ในการวัดผลได้อย่างง่ายดาย ไม่ว่าจะเป็น linear and non-linear models หรือ time series analysis เป็นต้น

 

Screen Shot 2017-05-24 at 02.20.50

 

เป็นอย่างไรกันบ้างคะ 5 ไลบรารี่เด็ดแห่งปี เคยผ่านมือกันมาบ้างรึยังคะ ถ้ายังไม่เคยก็อย่าลืมไปลองใช้กันนะคะ การ  Install library ใน Python ง่ายและ สะดวกรวดเร็วมากๆ แล้วบทความต่อไป เราจะมาทัวร์ อีก top 5 libraries  ทางฝั่งของ Machine Learning กันว่ามีอะไรบ้าง?

 

13062103_233130583716199_6224283738921716075_n
Enjoy Python!

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s