เมื่ออาทิตย์ที่ผ่านมา แอดเริ่มงานแรกที่ออสเตรเลียครับ ซึ่งเป็นบริษัท Consult ด้าน Data Science และได้ไปเข้าร่วมงาน Hackathon ที่จัดขึ้นในบริษัทมา ทำให้ได้เรียนรู้เกี่ยวกับเรื่อง Cloud เยอะมาก ก็เลยเอามาสรุปเป็นบทความเล่าสู่กันฟังครับ

บทความนี้จะเล่าให้ฟังว่า Cloud Computing คืออะไร และทำไมถึงเหมาะกับงานด้าน Data Science และ Machine Learning แบบเรามาก ๆ ครับ

Cloud Computing คืออะไร

หลาย ๆ คนอาจจะใช้ระบบ Cloud อยู่แล้วสำหรับเก็บไฟล์ เช่น Dropbox, iCloud แต่จริง ๆ Cloud สามารถทำได้มากกว่านั้นเยอะมาก

Cloud Computing แบบเข้าใจง่าย ๆ คือ การที่มีคนเอาคอมพิวเตอร์ไปต่ออินเตอร์เน็ตไว้ แล้วให้เราสามารถจ่ายเงินเพื่อเช่าใช้งานได้ผ่านออนไลน์นั่นเองครับ นึกถึงร้านอินเตอร์เน็ตน่าจะเข้าใจง่ายขึ้น

หรือถ้าใครมีความรู้ด้านการทำเว็บไซต์มาก่อน ก็นึกถึงเวลาเราเช่าโฮสติ้งเว็บไซต์ก็ได้ครับ คอนเซปต์ของ Cloud Computing เหมือนกันเลย

สิ่งที่แตกต่างจากการเช่าโฮสต์ทำเว็บไซต์ทั่วไป ก็คือ Cloud Computing เจ้าดัง ๆ เค้าจะมีบริการหลากหลายรูปแบบ เช่น มีระบบ API ที่สามารถอ่านตัวหนังสือจากรูปได้ (Text Recognition) หรือสามารถหาหน้าคนได้ (Facial Recognition)

สาเหตุที่เค้าเรียกว่า Cloud (ก้อนเมฆ) ก็คือ คอมพิวเตอร์ที่เราใช้งานไม่ได้อยู่ใกล้เรา แต่ไปอยู่ในที่ที่อาจจะห่างไกลออกไปคนละมุมโลกก็ได้ เหมือนอยู่บนกลุ่มก้อนเมฆนั่นเอง

ปัจจุบันบริษัทใหญ่ ๆ ทั่วโลกก็เลือกรันระบบบน Cloud กันทั้งนั้นครับ เช่น Google, Microsoft, Amazon, Netflix เดี๋ยวเรามาดูกันว่าทำไม Cloud ถึงน่าใช้

Cloud Computing มีไว้ทำไม แก้ปัญหาอะไร

5 เหตุผล ทำไมเราถึงควรใช้ Cloud Computing

สิ่งที่สำคัญกว่าการรู้ว่า Cloud Computing คืออะไร ก็คือ เราควรรู้ว่า” Cloud Computing เกิดมาแก้ปัญหาอะไร” นั่นเองครับ เราจะได้เลือกมาใช้ได้ถูกสถานการณ์

ในสมัยก่อน ถ้าบริษัทหนึ่งต้องการคอมพิวเตอร์แรง ๆ ในการประมวลผลต่าง ๆ หรือแม้แต่ต้องการเก็บข้อมูลที่เพิ่มขึ้นจำนวนมากในทุก ๆ วัน เค้าก็ต้องวางเครื่อง Server เอง และจ้างผู้ดูแลระบบ (หรือที่เราเรียกว่า System Admin) มาดูแลเซิร์ฟเวอร์ของเรา

ทีนี้พอบริษัทขยายขึ้นไปเรื่อย ๆ เราก็ต้องจ่ายเงินซื้อเซิร์ฟเวอร์ที่แรงขึ้น และ Hardware ที่ความสามารถสูงขึ้น ราคาก็แพง แถมยังเจอปัญหาว่าเซิร์ฟเวอร์เก่าที่ซื้อมาแล้วไม่รู้เอาไปทำอะไรดี กลายเป็นต้นทุนจมไปอีก

ทางออกของปัญหาเหล่านี้ก็คือ… Cloud Computing !

Cloud Computing เกิดมาจากว่า บริษัทยักษ์ใหญ่ระดับโลกมีเครื่องเซิร์ฟเวอร์อยู่เยอะมาก ๆ เพื่อรองรับลูกค้าทั่วโลก ก็เลยพัฒนามาเป็นบริการที่ให้บริษัทอื่น ๆ สามารถจ่ายเงินเพื่อมาแชร์กันใช้ทรัพยากรเหล่านี้ได้ โดยที่บริษัทอื่น ๆ จ่ายแค่ค่าบริการรายชั่วโมง ไม่ต้องจ่ายค่า System Admin เพื่อดูแลระบบใด ๆ ทั้งสิ้น

พอบริษัทไหนต้องการอะไร ก็มาเช่าใช้งานเซิร์ฟเวอร์ได้ตามรายชั่วโมง อยากได้เซิร์ฟเวอร์แรงขนาดไหนก็เลือกเองได้ หรือจะเปลี่ยนไปใช้เครื่องแรง ๆ ตอนคนเข้าเยอะ ๆ เช่น โปรโมชั่นปลายปี แล้วช่วงตลาดเงียบ ๆ ก็ใช้เครื่องถูก ๆ ก็ไม่มีใครว่า ถือเป็นการประหยัดค่าใช้จ่ายที่ดีมาก ๆ

เอาราคาของ AWS EC2 มาให้ดูกันครับ จะเห็นว่าถูกสุดอยู่ที่ ชม ละ 24 สตางค์เท่านั้น ตกเดือนละ 172 บาท บางคนกินข้าวมื้อเดียวอาจจะแพงกว่าค่าเซิร์ฟเวอร์ทั้งเดือน

นอกจากนั้นค่าใช้จ่ายก็ถือว่าถูกมาก ๆ ถ้าเป็นนักเรียน อยากทำโปรเจคเล่น ๆ ก็ใช้ Free Tier (สามารถใช้ทรัพยากรจำนวนหนึ่งได้ฟรี) หรือถ้าใช้ทรัพยากรเยอะมากจ่ายเป็นชั่วโมง ซึ่งเริ่มต้นที่ชั่วโมงละไม่ถึงบาท (1 vCPU + แรม 512 MB) ไปถึงแพงสุดประมาณ 180 บาทต่อชั่วโมง (96 vCPU + แรม 256 GB)

นอกจากนั้นตัวระบบ Cloud ก็เชื่อถือได้ เพราะส่วนใหญ่จะมีการรับประกันว่าจะมีโอกาสล่มน้อยมาก (ซึ่งบางครั้งผู้ให้บริการโฮสต์ติ้งเว็บไซต์ไม่มีในส่วนนี้ให้ เว็บก็ล่มกันไปเพลิน ๆ) และตัวระบบ Cloud ก็เชื่อมต่อกับ Data Center ในหลายประเทศทั่วโลก ทำให้ข้อมูลของเราหายยากมาก ๆ ถ้าจะหายได้คือ Data Center ของเค้าทั้งหมดต้องล่มพร้อมกันเท่านั้น ซึ่งโอกาสน้อยมาก ๆ ครับ

Cloud Computing ช่วยให้งาน Data Science / Machine Learning ง่ายขึ้นอย่างไร

หน้าตาห้องเซิร์ฟเวอร์ ซึ่งที่บริษัทของหลาย ๆ ท่านอาจจะมีเหมือนกัน

ถ้าใครอ่านหัวข้อที่แล้วอาจจะพอนึกออกแล้วครับ เพราะงานของสาย Data Science อย่างเรานี่เหมือนเกิดมาเพื่อใช้ Cloud เลย:

  • งาน Data Science: ใช้พื้นที่เก็บข้อมูลเยอะมหาศาล (กระแส Big Data ที่กำลังมาแรงนั่นเอง) ซึ่งถ้าจะเก็บข้อมูลไว้เองต้องซื้อ Hardware ราคาแพง แถมต้องดูแลเอง ถ้าล่มก็ไม่รู้จะหันไปหาใคร (จริง ๆ เราใช้ Cloud ก็ต้องมีจ้างคนดูแลระบบอยู่ดีครับ เพราะระบบของบริษัทส่วนใหญ่มีความซับซ้อน แต่คนดูแลระบบก็จะทำงานได้ง่ายขึ้นกว่าเวลาตั้งเซิร์ฟเวอร์เองในตึก หรือที่เราเรียกว่า On-premise)
  • งาน Machine Learning: ใช้คอมพิวเตอร์ที่มีพลังประมวลผลสูง (โดยเฉพาะสาย Deep learning, Tensorflow, Keras ฯลฯ ทั้งหลาย) และไม่ได้รันหนักตลอดเวลาด้วย เราใช้เยอะ ๆ แค่ตอนเทรนด์โมเดลเท่านั้น ซึ่งถ้าเอาเงินไปซื้อคอมพิวเตอร์แรง ๆ มาตั้งที่บริษัท แล้วไม่ได้ใช้ตลอด ก็ถือเป็นต้นทุนจม

ตัวอย่างหนึ่งที่แอดเห็นประโยชน์ของ Cloud ชัดเจนเลยก็คือ ประมาณ 2 ปีที่แล้ว แอดได้ไปฝึกงานที่แล็บของมหาวิทยาลัย ได้เจอกับนักศึกษาที่ทำโปรเจคปริญญาเอกโดยใช้ Tensorflow สร้างโมเดล ซึ่งเค้าใช้วิธีซื้อคอมพิวเตอร์แรง ๆ มาตั้งไว้ในแล็บ ลงการ์ดจอ GPU สำหรับเทรนด์โมเดลโดยเฉพาะ และเสียบเปิดไว้ที่แล็บ 24 ชั่วโมง พอจะใช้สั่งรันก็เอาโน้ตบุ๊ก Remote เข้าไปใช้งาน

ถ้านักศึกษาคนนี้เลือกใช้ Cloud เค้าก็จะสามารถเลือกคอมพิวเตอร์แรงแค่ไหนก็ได้ และเปิดเฉพาะช่วงที่ใช้งานก็พอ จ่ายแค่เท่าที่รันจริง ๆ ไม่ต้องไปซื้อคอมพิวเตอร์มาตั้งไว้ และเสียเวลาเซ็ตอัพระบบเองทั้งหมด ซึ่งประหยัดทั้งเงินและเวลา

ถ้าสนใจอยากใช้ Cloud มีตัวเลือกอะไรบ้าง

บริษัทใหญ่ ๆ เช่น Amazon, Google, Microsoft, IBM ต่างก็มีให้บริการระบบ Cloud Computing ทั้งนั้นครับ ซึ่งจริง ๆ ใช้เจ้าไหนก็ได้ตามความชอบ แต่หลัก ๆ ที่แอดมินเห็นว่าได้รับความนิยมมาก คือ:

ถ้าไม่รู้จะเรียนตัวไหนดี แอดแนะนำว่าเรียน AWS ไปก่อน เพราะเค้าถือเป็น Cloud เจ้าแรก ๆ ของเราโลกเลย เปิดมาตั้งแต่ปี 2002 ซึ่งก็ครอง Market Share เยอะที่สุดด้วยครับ เราต้องดูกันต่อไปว่า Google กับ Microsoft จะเข้ามากินส่วนแบ่งได้ขนาดไหน

Market Share ของผู้ให้บริการ Cloud ครับ จะเห็นว่า AWS นำแบบทิ้งห่างเลย (รูปจาก CNBC)

เมื่อก่อนแอดก็ไม่เข้าใจว่าทำไมเว็บไซต์ขายของออนไลน์แบบ Amazon.com ถึงมาให้บริการพวกนี้ครับ แต่พอได้เรียนรู้การใช้ AWS และได้ลองใช้บริการต่าง ๆ ของ AWS แล้วต้องบอกเลยว่าเค้าทำมาดีมากจริง ๆ

และสำหรับใครอยากเรียนรู้การใช้งาน AWS แอดมีของมาฝากครับ เพราะอาทิตย์แรกที่เริ่มงาน (คืออาทิตย์ที่ผ่านมานี่แหละ) บริษัทส่งไปเทรนด์การใช้งาน AWS มาครับ

ซึ่งการเทรนด์ก็คือ… ให้นั่งดูคอร์สใน Udemy ชื่อ AWS Certified Developer – Associate 2018

เพราะฉะนั้น ทุกคนท่านอยู่ที่บ้านสามารถซื้อคอร์สนี้มานั่งดูกันเองได้ครับ ถ้ามีโปรก็จะเหลือประมาณ 300 บาทเท่านั้นเอง แต่เนื้อหาคอร์สสอนละเอียดและดีมาก ๆ เกินคุ้มครับ

งาน AWS re:Invent 2018 ที่ลาสเวกัส

ปีนี้บริษัทส่งไปงาน AWS re:Invent ครับ

AWS re:Invent เป็นงานประจำปีของ Amazon เกี่ยวกับ AWS โดยเฉพาะ ซึ่งในงานก็จะมี Session ให้เข้าไปฟัง, Workshop, Hackathon, Bootcamp, และ Expo รวมถึงปาร์ตี้ตอนดึก งานจัด 5 วันยาว ๆ บัตรเข้างาน $1,799 หรือประมาณ 59,900 บาท ครับ

เมื่ออาทิตย์ที่ผ่านมาที่เห็นเพจเงียบ ๆ คือแอดไปซุ่มทำโปรเจคแข่งงาน Hackathon ที่บริษัทอยู่ครับ ซึ่งมีธีมเป็น AWS เลยได้เริ่มเรียนรู้การใช้งาน และเรียนรู้ Product ต่าง ๆ ใน AWS

จากที่แอดเคยลองเรียนมาหลายวิธี ไม่ว่าจะเป็นการอ่านหนังสือ การดูวีดิโอ แอดค้นพบว่าการเรียนรู้สิ่งต่าง ๆ ไม่มีอะไรที่ได้ผลไปกว่า “การลงมือทำ” แล้วครับ เราต้องลองทำจริง ลองแก้ปัญหาจริง ความรู้ถึงจะซึมเข้าสมอง

ก่อนแข่ง Hackathon รอบนี้ไม่เคยได้เรียนมาก่อนเลยครับ ก็เหมือนถูกบังคับให้เรียนด้วยตัวเองในระยะเวลาจำกัด เพราะรางวัลต้องยอมรับว่าล่อตาล่อใจมาก ๆ (ที่ 1 ได้ตั๋วไปลาสเวกัส, ที่ 2 ได้ตั๋วไปซิดนีย์)

และจากการเตรียมตัวทั้งก่อนเริ่มแข่ง และก่อนพรีเซ้นท์ นอนตี 1 ตี 2 ติดกันเป็นอาทิตย์ (งานนี้ให้ Hack 2 วัน แล้วเตรียมตัวพรีเซ้นท์อีก 4 วัน) ก็ได้ตั๋วไปลาสเวกัส กับบัตรเข้างาน AWS re:Invent 2018 มาครองครับ ถือว่าคุ้มเหนื่อยอยู่เหมือนกัน

แน่นอนว่าเดี๋ยวเก็บความรู้เด็ด ๆ มาฝากเพื่อน ๆ กันเหมือนเคยครับ หรือใครไปงานก็ทักมากันหลังไมค์ได้เผื่อจะนัดเจอกันครับ ใครไม่ได้ไปก็ไม่ต้องเสียใจ ติดตามอ่านได้เลยในเพจ Data Science ชิลชิล ช่วงเดือนธันวาคมครับผม

คุณอยากอ่านบทความแนวนี้อีกมั้ย ?

ลงทะเบียนรับ GrowthBee Newsletter เพื่ออ่านบทความใหม่ ๆ ด้าน Data Science ก่อนใคร !!

I agree to have my personal information transfered to MailChimp ( more information )

เราสัญญาว่าจะไม่มีการแสปมใด ๆ ทั้งสิ้น และคุณสามารถยกเลิกรับข่าวสารตอนไหนก็ได้