ในฐานะนักพัฒนาซอฟต์แวร์ที่เน้นการสร้างผลิตภัณฑ์บนเว็บเป็นหลัก ฉันรู้สึกสนใจเทคโนโลยีใหม่ๆ มาโดยตลอด ความสนใจใน AI ที่เพิ่มขึ้นอย่างมาก โดยเฉพาะอย่างยิ่งหลังจากการเปิดตัว ChatGPT ได้จุดประกายความปรารถนาของฉันที่จะเจาะลึกในสาขาที่น่าสนใจนี้ นี่คือเรื่องราวการเดินทางของฉัน
ฉันเริ่มต้นด้วยวิดีโอ YouTube (คำอธิบายของ Wolfram) ที่อธิบายว่า ChatGPT คาดการณ์คำถัดไปในประโยคได้อย่างไร (หากคุณไม่ต้องการดูวิดีโอ คุณสามารถอ่าน บทความถอดความ) บทนำนี้เป็นการเปิดโลกทัศน์—มันแสดงให้เห็นว่า AI โดยเฉพาะอย่างยิ่ง large language models (LLMs) มีความก้าวหน้าไปมากเพียงใด นอกจากนี้ยังแนะนำแนวคิดพื้นฐานในแวดวง LLM ซึ่งเป็นรากฐานสำหรับการสำรวจที่ลึกซึ้งยิ่งขึ้นของฉัน
จากนั้น ฉันเริ่มเรียนรู้เกี่ยวกับ LLM ที่แตกต่างกัน เช่น Llama, GPT, Claude และอื่นๆ ช่วงนี้เป็นเรื่องของการทำความเข้าใจด้านเทคนิค เช่น ความยาวบริบท, โทเค็น (อินพุตและเอาต์พุต), พารามิเตอร์, การฝัง, FLOPS (Floating Point Operations Per Second), RAG (Retrieval-Augmented Generation) เพื่อให้เป็นรูปธรรมมากขึ้น ฉันได้ทดลองใช้ LLM ในเครื่องโดยใช้เครื่องมืออย่าง Ollama นี่เป็นประสบการณ์ตรงครั้งแรกของฉันกับโมเดลในเครื่อง และฉันรู้สึกทึ่งกับศักยภาพของมัน
แหล่งข้อมูลบางส่วนในช่วงนี้:
- สิ่งที่คุณต้องรู้เกี่ยวกับการทำ Tokenization ใน LLMs
- คู่มือเริ่มต้นใช้งาน Llama Recipes
- ทุกสิ่งที่ฉันได้เรียนรู้เกี่ยวกับการรัน LLM ในเครื่อง
ต่อไป การทำความเข้าใจคำศัพท์ทางเทคนิคเหล่านั้นยังไม่เพียงพอ เราต้องสำรวจและลงมือปฏิบัติจริงเพื่อทำความเข้าใจอย่างแท้จริงว่าคำศัพท์เหล่านี้เชื่อมโยงกันอย่างไร และมีบทบาทที่ไหน และทำไมจึงจำเป็น ฉันสำรวจสิ่งเหล่านี้โดยใช้ Jupyter Notebook ซึ่งเป็นเครื่องมือที่ช่วยให้ฉันสามารถรันคำสั่ง Python สำหรับงานต่างๆ ได้ สิ่งนี้นำฉันไปสู่แพลตฟอร์มต่างๆ เช่น LangChain และ Kaggle ซึ่งฉันได้ทดลองฝึกฝน LLM ขั้นพื้นฐานและการปรับแต่งโมเดล ประสบการณ์เหล่านี้ช่วยให้ฉันเข้าใจว่าโมเดล AI ได้รับการฝึกฝนและปรับแต่งอย่างไร ทำให้ฉันได้เห็นภาพรวมที่ครอบคลุมมากขึ้นเกี่ยวกับความสามารถของโมเดล
แหล่งข้อมูลบางส่วนในช่วงนี้:
ด้วยความรู้ที่เพิ่มขึ้นนี้ ฉันเริ่มสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI (Sudoku, Page Saver) โดยใช้เครื่องมือต่างๆ เช่น Cursor และ Windsurf ซึ่งได้รับการปรับปรุงด้วยโปรแกรมแก้ไขที่ขับเคลื่อนด้วย AI ฉันตระหนักได้อย่างรวดเร็วว่า AI สามารถเปลี่ยนแปลงนักพัฒนาได้อย่างไร ความท้าทายมากมายที่ฉันเผชิญในการพัฒนาซอฟต์แวร์สามารถปรับปรุงให้มีประสิทธิภาพมากขึ้น หรือแม้กระทั่งแก้ไขได้ทั้งหมดด้วย AI นี่เป็นช่วงเวลาสำคัญที่เน้นย้ำถึงศักยภาพอันมหาศาลของ AI ในการปรับเปลี่ยนวิธีการทำงานของเรา
แม้ว่าการเดินทางของฉันยังคงดำเนินต่อไป แต่สิ่งหนึ่งที่ชัดเจนคือ AI ไม่ใช่แค่กระแส แต่เป็นอนาคต ทุกย่างก้าวที่ฉันได้ก้าวไปได้เพิ่มพูนความซาบซึ้งในสาขานี้และโอกาสต่างๆ ที่มี ฉันรู้สึกตื่นเต้นที่จะได้เห็นว่าการเดินทางครั้งนี้จะนำฉันไปที่ใดต่อไป และ AI จะยังคงปฏิวัติชีวิตของเราต่อไปได้อย่างไร ทั้งในฐานะนักพัฒนาและในฐานะบุคคลทั่วไป