SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

Session 1: ACL & LLM Roadmap in Thailand

กลับมาอีกครั้งกับงาน SCBX Unlocking AI คราวนี้กลับมาใน EP 9 ภายใต้หัวข้อ Advancing ThaiLLM Development and Applications เพื่อนำเสนอเรื่องราวเกี่ยวกับ AI และ LLM ที่กำลังอยู่ในความสนใจของผู้คนทั่วโลกนับตั้งแต่ ChatGPT ถือกำเนิดขึ้น

งานนี้มีหัวข้อเสวนาน่าสนใจหลายหัวข้อ โดยเริ่มแรกได้ ดร.เทพชัย ทรัพย์นิธิ Vice President, AiAT & Director of Artificial Intelligence Research จากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (National Electronics and Computer Technology Center : NECTEC หรือเนคเทค) มาบรรยายเรื่อง ACL & LLM Roadmap in Thailand 

แต่ก่อนจะอธิบายเรื่อง LLM ดร.เทพชัย เกริ่นถึงสิ่งที่เรียกว่า ACL ก่อนว่าคืออะไร และสำคัญอย่างไรกับโลก AI และ LLM 

โดย ACL นั้นมี 2 ความหมายดังนี้

  1. Annual Meeting on Computational Lingustics หรือการจัดประชุมวิชาการของเหล่านักภาษาศาสตร์คอมพิวเตอร์ ซึ่งเป็นงานที่เก่าแก่ จัดมาตั้งแต่ปี 1962 แต่เดิมเคยใช้ชื่อ Association on Machine Translation and Computation Linguistics 
  2. Association of Computational Linguistics หรือผู้ที่ดูแลและจัดงานประชุมนี้ขึ้นมานั่นเอง หากขาดงานนี้และคณะผู้จัดไป อาจส่งผลให้ความตื่นตัวในแวดวง AI เปลี่ยนจากหน้ามือเป็นหลังมือ 

ดร.เทพชัย ให้ข้อมูลเพิ่มเติมว่าการประชุม ACL จัดขึ้นที่สหรัฐอเมริกามาตลอด จนกระทั่งปี 1996 ที่เริ่มไปจัดประเทศอื่นบ้าง เช่นที่แคนาดา สเปน ก่อนจะมาจัดที่เอเชียครั้งแรกที่ฮ่องกงเมื่อปี 2000 

และเดือนสิงหาคม 2024 นี้ประเทศไทยก็จะเป็นเจ้าภาพจัดประชุมด้วย ซึ่งเขาเองก็จะไปร่วมงานเช่นกัน หลังเข้าร่วมงาน ACL มาตั้งแต่ปี 2009 แล้ว

ดร.เทพชัย มองว่าวันนี้เราเห็นประโยชน์ของ AI และ LLM ที่เป็นรูปธรรมมากขึ้น เหตุผลก็เพราะการถือกำเนิดของ ChatGPT ในเวลาไม่กี่ปียังเกิด LLM ที่เป็น Multilingual ทั้งของ Google, Microsoft, Meta, Apple และ OpenAI ซึ่งเน้นภาษาอังกฤษ มี LLM ที่ประเทศจีนพัฒนาขึ้นโดย Baidu, Huawei และ Qwen 

ส่วนประเทศไทยก็มี LLM ภาษาไทยเช่นกัน เช่น OpenThaiGPT และ Typhoon เป็นต้น

ดร.เทพชัย ยังบอกว่าไทยวาง Roadmap มียุทธศาสตร์เป้าหมาย และผลลัพธ์ตามแผนปฏิบัติการด้าน AI จำนวน 5 ข้อ โดยยุทธศาสตร์ด้าน LLM อยู่ในด้านที่ 2 ด้วย ซึ่งแสดงให้เห็นว่าประเทศไทยให้ความสำคัญกับเรื่องนี้มาก และน่าจะเป็นประโยชน์ต่อการเอาไปใช้ในเชิงธุรกิจ หรือการศึกษาวิจัยในอนาคต 

โดยตอนนี้ เขาและทีม NECTEC ได้รับคำเรียกร้องจากทั้งหน่วยงานรัฐและเอกชนเยอะมาก เพื่อให้ช่วยสร้าง LLM ที่มีความเฉพาะด้าน เอามาช่วยงานที่มีความเฉพาะเจาะจงกับแต่ละองค์กร ซึ่งต้องมาติดตามกันต่อไปว่า จะพัฒนาและนำมาใช้งานอย่างไร

อีกงานสำคัญคือการจับมือกับสำนักงานการวิจัยแห่งชาติ (วช.) กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม และกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม เพื่อสร้าง LLM 3 โมเดลคือ

  1. Pretrained LLM เป็น Base Model ที่เก่งกาจในการใช้ภาษาไทย ซึ่งทุกคนสามารถใช้งานร่วมกันได้ 
  2. Fine Tuning Model เพื่อรองรับงานด้านการท่องเที่ยว การแพทย์ และสิ่งแวดล้อม
  3. Opensourced Model ที่องค์กรเอกชนจะสามารถนำไปพัฒนาและต่อยอดให้กับอุตสาหกรรมอื่นๆ ที่ตนเองทำงานอยู่ได้

อีกสิ่งที่กำลังทำอยู่คือ Chatbot Arena หรือการเอา Chatbot แต่ละตัวมาคุยกันเอง เพื่อให้ทราบว่า ข้อมูลจาก Bot ตัวไหนถูกต้อง ใช้งานง่าย ใช้งานได้จริงกว่ากัน 

อีกสิ่งที่ดร.เทพชัยเน้นย้ำคือ การเอา AI มาใช้จะต้องมีความปลอดภัยและไว้ใจได้ จึงเกิดโครงการพัฒนา Trustworthy AI Framework ขึ้นมา เป็นการเอา LLM แต่ละตัวมาศึกษาว่ามันเข้าข่ายความปลอดภัยจากเรื่องบ้าง เช่น ความรุนแรง การละเมิดกฎหมาย ความลามกอนาจาร รวมถึงเป็นมิตรต่อสุขภาพจิต และดีต่อสังคมและวัฒนธรรมไทยหรือไม่ เป็นต้น

สุดท้าย ดร.เทพชัย ยังกาง Roadmap ที่ทาง NECTEC ได้วางแผนไว้คร่าวๆ ไว้ว่าภายใน 5 ปีจากนี้จะพัฒนา OpenThaiGPT ที่พัฒนามากขึ้น โดยปี 2028 จะพัฒนา OpenThaiLLM และ Multimodel OpenThaiLLM เวอร์ชั่น 3.0.0 สำหรับใช้งานงาน 3D World Instruction ให้ได้

หากทุกอย่างเป็นไปตามแผนที่วางไว้ เราน่าจะได้เห็นความท้าทาย ความแปลกใหม่ และสิ่งที่น่าตื่นตาตื่นใจเกิดขึ้นแก่ประเทศไทยอีกมากมายตามมาแน่นอน

Session 2: Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration 

จากที่โลกนี้มีกำแพงด้านภาษาขวางกั้น การจะสื่อสารกับชาวต่างชาติต้องใช้ความรู้และสั่งสมประสบการณ์นานพอตัว แต่การมาถึงของ Generative AI และการพัฒนาอย่างก้าวกระโดดของ LLM ทำลายกำแพงทางภาษาอย่างราบคาบ 

จนตอนนี้ไม่แค่ในสหรัฐอเมริกา หรือในยุโรปเท่านั้นที่กำลังพัฒนา LLM ที่ฉลาดและล้ำสมัย แต่ในเอเชีย โดยเฉพาะในภูมิภาคเอเชียตะวันออกเฉียงใต้นั้นก็กำลังพัฒนาเช่นกัน แถมหลายประเทศยังร่วมมือกันอย่างน่าจับตามองด้วย

ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa หนึ่งในผู้บุกเบิกด้าน LLM ในไทย มาบรรยายเรื่อง Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications เพื่ออธิบายว่าการศึกษา วิจัย และพัฒนาด้าน LLM ในแถบเอเชียตะวันออกเฉียงใต้ตอนนี้รุดหน้าไปไกลเพียงใด 

หนึ่งในโครงการที่เด่นมากอยู่ที่ประเทศสิงคโปร์ ชื่อว่า SEALD (Southeast Asian Languages in One Network Data) หรือเรียกง่ายๆ ว่า AI Singapore เป็นโครงการที่เชิญชวนนักวิจัยในประเทศเพื่อนบ้านมาร่วมมือกันสร้าง LLM ที่โดดเด่นด้านภาษาท้องถิ่นของเอเชีย

เนื่องจากประเทศในแถบเอเชียตะวันออกเฉียงใต้ล้วนมีภาษาหลักของแต่ละประเทศอยู่แล้ว ไม่เพียงแค่นั้นยังมีภาษาถิ่น หรือภาษารอง อีกนับพันภาษา การที่โครงการมุ่งพัฒนา LLM ที่มีข้อมูลของภาษาต่างๆ ในภูมิภาคนี้ ถือเป็นการใช้ความหลากหลาย หรือ Diversity ให้เกิดประโยชน์นั่นเอง

ทั้งนี้ หากนักวิจัยจะทำ R&D พัฒนา LLM อย่างมีประสิทธิภาพ จะต้องมีการวัดผลที่ดีด้วย แต่ปัญหาของการพัฒนา LLM ทุกวันนี้คือยังวัดผลได้ยาก ไม่แค่เฉพาะในแถบเอเชีย แต่แม้กระทั่ง LLM ภาษาอังกฤษเองก็ยังมีปัญหานี้อยู่

โดย ศ.ดร.สรณะ แจกแจงว่ามี 4 อุปสรรคสำคัญในการวัดผลดังนี้

  1. Sparse Evaluation Data - มีเพียงไม่ถึง 10 ภาษาเท่านั้น ที่ถูกนำมาใช้พัฒนาและให้ AI เรียนรู้
  2. Resource Gap - ในจำนวน 1,308 ภาษาในแถบเอเชียตะวันออกเฉียงใต้ มี 700 ภาษาที่มีข้อมูลหรือ Datasets ที่ถูกต้องสำหรับใช้วัดผลน้อย แค่ 1-2 Datasets เท่านั้น
  3. Quality of Resources คุณภาพของข้อมูลที่อยู่ในอินเทอร์เน็ต ยังไม่ได้รับการยืนยันว่าถูกต้องเพียงพอจะนำไปใช้งานต่อได้
  4. Cultural Relevance ข้อมูล หรือศัพท์เฉพาะเกี่ยวกับภาษารองหลายภาษา แปลมาจากภาษาอังกฤษอีกที อาจไม่สอดคล้องกับวัฒนธรรมหรือบริบทจริงๆ ของพื้นที่นั้น

ทั้งนี้รัฐบาลสิงคโปร์เข้าใจปัญหานี้ดี จึงพัฒนาโครงการ SEACrowd ขึ้นมาเพื่อรวบรวม Datasets ของประเทศในแถบเอเชียตะวันออกเฉียงใต้อย่างเป็นทางการ และมีนักวิจัยของ Vistec เข้าไปมีร่วมในโครงการด้วย 

ศ.ดร.สรณะ คาดหวังว่า SEACrowd จะเป็น Benchmark ที่ดีที่ช่วยให้มั่นใจว่า Data ที่ได้มาจะนำเสนอถึงความเป็นภูมิภาคเอเชียตะวันออกเฉียงใต้ได้จริงๆ ไม่ใช่การคิดไปเอง หรือแปลมาจากแหล่งข้อมูลของประเทศตะวันตกอีกที

เพราะอย่าลืมว่าการพัฒนา LLM แล้ววัดผลด้วย Benchmark ที่ถูกต้อง ใช้งานได้จริง มีผลอย่างยิ่งต่อการตีพิมพ์หรือไม่ได้ตีพิมพ์งานวิจัย ไปจนถึงการพัฒนาต่อเป็นผลงานที่ใช้ได้จริงด้วย จะช่วยนำทางนักวิจัยไปสู่เป้าหมาย และทำให้นักวิจัยรู้ว่าปัญหาไหนที่ต้องแก้ไข ปัญหาไหนไม่ต้องแก้ไขอะไรแล้ว สิ่งไหนที่จะช่วยพัฒนา LLM ให้ดียิ่งขึ้นต่อไป เป็นต้น

แต่ก็มีข้อควรระวังในการวัดผลด้วยเช่นกัน ศ.ดร.สรณะ ยกตัวอย่างเปเปอร์ชื่อ Don’t Make Your LLM an Evaluation Benchmark Cheater ที่ได้ข้อสรุปว่า ให้ระวังการตั้งใจวัดผลให้ออกมามีตัวเลขที่ดูดี ดูสวยที่สุด แต่กลับไม่สามารถเอาไปใช้งานจริงได้เมื่อต้องทำงานจริง เพราะมันไม่ต่างอะไรกับนักเรียนที่ตั้งใจอ่านหนังสือเพื่อสอบให้ได้คะแนนดี แต่เอาความรู้ที่ได้มานั้นไปใช้ประโยชน์อะไรไม่ได้ 

ส่วนในอนาคต ศ.ดร.สรณะ ยืนยันว่าไทยจะร่วมมือกับโครงการ SEACrowd ต่อไป เพื่อนำภาษาไทยที่มีความเป็นภาษาถิ่น เข้าไปอยู่ในฐานข้อมูลกลาง ให้คนทั่วโลกได้รู้จักมากขึ้นต่อไป

Session 3: Understanding Textual Embeddings: Applications in Retrieval and Recommendation 

เคยสงสัยไหมว่า เว็บไซต์ประกาศรับสมัครงานอย่าง JobTopGun หาวิธีช่วยให้ผู้สมัครงานได้งานที่ใช่ได้อย่างไร คำตอบอยู่ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications ที่ผ่านมานั่นเอง!

อ.ดร.เอกพล ช่วงสุวนิช จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย มาบรรยายเรื่อง Understanding Textual Embeddings: Applications in Retrieval and Recommendation และเล่าประสบการณ์ที่เคยฝึกฝนและพัฒนา LLM อย่างไรบ้าง โดยมีกรณีศึกษาคือ JobTopGun นั่นเอง

ดร.เอกพล บอกว่ามนุษย์เรามีความสามารถในการตีความ เรารู้ว่า ประโยคไหนมีความหมายเหมือนหรือใกล้เคียงกับประโยคไหนบ้าง เช่น A Little Girl Seems to be Very Sad มีความหมายใกล้เคียงกับ The Little Child is Far From Being Happy

แต่เมื่อจะพัฒนา LLM ก็ถือเป็นความท้าทายเหมือนกันว่า เราจะต้องป้อนข้อมูลอย่างไรให้คอมพิวเตอร์เข้าใจความหมายของประโยคที่เขียนไม่เหมือนกัน แต่ความหมายเหมือนหรือใกล้เคียงกันได้ด้วย 

ดร.เอกพล ยกตัวอย่างว่า เขาเคยฝึกระบบของ JobTopGun เว็บไซต์ประกาศหางานที่เปิดโอกาสให้ผู้คนเอาเรซูเม่สมัครงานมาอัปโหลดในเว็บไซต์ หน้าที่ของเขาคือทำอย่างไรก็ได้เพื่อหาทางจับคู่เรซูเม่ต่างๆ ให้เจอตำแหน่งงานที่เหมาะสมให้ได้

เขาจึงฝึกให้ปัญญาประดิษฐ์อ่านเรซูเม่ของผู้สมัครงาน และ Job Description ของแต่ละงานจากแต่ละองค์กร จนมันรู้จักลักษณะงานที่เหมาะสมของแต่ละคน จนเข้าใจว่าถ้าเจอว่าประวัติของคนๆ นี้ต้องไปทำงานแบบไหน กับบริษัทใด 

สำหรับเทคนิคในการเรียนรู้ที่ใบ้สอนปัญญาประดิษฐ์คร่าวๆ จะมี 2 แนวคือ Sparse Embeddings และ Dense Embedbings 

  1. Sparse Embeddings หมายถึงการให้ Machine Learning อ่านหนังสือแล้วนับว่าหนังสือเหล่านี้มี Keyword อะไร เยอะแค่ไหนบ้าง เช่น หนังสือของวิลเลียม เชกสเปียร์ มีคำว่า Battle กี่คำ หรือมีคำว่า Soilder กี่คำ เป็นต้น แล้วเอาผลที่ได้ไปวิเคราะห์ต่อข้อดีของ Sparse Embeddings คือใช้งานง่าย เข้าใจง่าย แต่ก็มีข้อควรระวัง เช่น บางกรณีอาจไม่เจอคำที่ต้องการให้นับ และบ่อยครั้งคอมพิวเตอร์อาจมองข้ามคำที่มีความหมายเดียวกัน แต่ไม่ใช่คำเดียวกัน ดังนั้นอาจต้องเปลี่ยนจากการนับจำนวนครั้ง เป็นการนับเปอร์เซ็นต์ หรือความถี่แทนว่าเจอคำนี้บ่อยแค่ไหน
  2. Dense Embedbings ป้อนข้อมูล หรือ Input สำหรับ Deep Learning  แล้วแปลงค่าสิ่งต่างๆ ออกมาเป็นตัวเลข หากเลขไหนเหมือนกัน หรือใกล้เคียงกัน หมายความว่าสามารถจับคู่สิ่งๆ นั้นกันได้ง่ายดร.เอกพล เล่าว่านี่คือวิธีการที่เขาสอนให้ Machine Learning ของ JobTopGun ได้เรียนรู้วิธีอ่านเรซูเม่ของผู้สมัครงาน โดย AI จะแปลงค่าเรซูเม่, Job Description หรือประกาศรับสมัครงานออกมาเป็นตัวเลข แล้วหากเลขนั้นเทียบกันแล้วได้ค่าใกล้เคียงกันหรือเท่ากัน ก็บ่งชี้ว่าเรซูเม่ของผู้สมัครงานเหมาะกับงานนั้นที่เปิดรับสมัครไว้นั่นเอง

ทั้ง Sparse และ Dense Embedbings ต่างมีข้อดีและข้อเสียแตกต่างกันไป ก่อนใช้ต้องดูว่ากรณีไหนที่ควรใช้ Sparse กรณีไหนควรใช้ Dense หรือจะนำมาใช้ร่วมกัน เพื่อดึงข้อดีของทั้ง 2 วิธีออกมาให้เต็มที่

ขอเพียงเข้าใจคอนเซ็ปต์ และวิธีการทำงาน ดร.เอกพลมั่นใจว่า เราจะสามารถพัฒนาสิ่งที่น่าสนใจได้อีกมากมาย เพื่อยกระดับการทำงานของตัวเองและองค์กรต่อไป

Session 4: Investment Insights Unleashed: AI-Powered Digital RM and Customer Service

คนที่จะเป็นนักลงทุนประสบความสำเร็จ สิ่งที่ขาดไม่ได้คือต้องติดตามข้อมูลข่าวสารตลอดเวลา แต่เพราะข้อมูลข่าวสารยุคนี้มาเร็วมาไวจนยากจะตามทันได้ การพลาดข้อมูลสำคัญไปเพียงนิดเดียว อาจส่งผลให้แทนที่จะได้ผลกำไร กลับขาดทุนมหาศาลในพริบตา

แต่จะเป็นอย่างไรหากนักลงทุนสามารถเข้าถึงข้อมูลที่จำเป็นต่อการลงทุนได้ง่ายขึ้น? คุณวีรินท์ ฉันทโรจน์ AI Transformation Lead จาก InnovestX ฉายภาพนั้นในการบรรยายเรื่อง Investment Insights Unleashed: AI-Powered Digital RM and Customer Service ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications อธิบายว่าแพลตฟอร์ม InnovestX เอา LLM มาใช้เพื่อให้ข้อมูลข่าวสารที่จำเป็นแก่นักลงทุนได้อย่างไร

คุณวีรินท์ เล่าว่า InnovestX มีฐานลูกค้าในปัจจุบันประมาณ 1 ล้านคน แต่คนส่วนใหญ่ประมาณ 98% เป็นลูกค้าทั่วไปที่มีเวลาลงทุนค่อนข้างน้อย เพราะต้องทำงานประจำ และไม่มีคนมาแนะนำการลงทุนส่วนบุคคลว่า ควรซื้อหุ้นตัวไหน ควรขายหุ้นตัวไหน ต้องเจียดเวลาทำงานไปติดตามข่าวสารจากแหล่งต่างๆ เอาเอง

และเนื่องจากการลงทุนในปัจจุบันไม่ได้มีแค่หุ้นไทย แต่ยังมีหุ้นต่างประเทศ มีกองทุนรวม พันธบัตร หุ้นกู้ให้เลือกซื้อได้ รวมถึงสินทรัพย์เสี่ยงอย่างคริปโตเคอร์เรนซี่ เราแทบไม่มีทางติดตามข่าวสารทันเลย หรือถ้าทัน เราจะไม่รู้เลยว่าข้อมูลที่ได้มา มีผลต่อพอร์ตในการลงทุนของเราเองแค่ไหน

อีกความท้าทายคือ ลูกค้ามักจะติดต่อเข้ามาสอบถามข้อมูลด้านการลงทุนจาก InnovestX ผ่านหลายช่องทาง ทำให้ Customer Service ต้องทำงานหนักเป็นพิเศษเพื่อรับเรื่องจากลูกค้า

ขณะเดียวกันก็เป็นไปได้ยากที่จะพัฒนาผู้เชี่ยวชาญด้านการลงทุนที่เป็นมนุษย์ ให้ทำงานเพื่อรองรับจำนวนลูกค้าที่เพิ่มขึ้นได้ทันด้วย

จากกรณีต่างๆ ที่สั่งสมมา จึงเกิดเป็นการพัฒนา AI-Powered Digital RM ผ่าน LLM ที่ชื่อ Typhoon เพื่อช่วยพนักงานของ InnovestX ในการทำงาน และช่วยให้ลูกค้าของแพลตฟอร์มให้สามารถเข้าถึงข้อมูลการลงทุนที่ตรงกับความต้องการที่สุด

ในการบริการลูกค้า InnovestX เอา AI เข้ามาช่วยทำงาน Customer Service เป็น Chatbot ให้บริการเปิดบัญชี หรือตอบคำถามการลงทุนขั้นพื้นฐาน ซึ่งช่วยลดปัญหา Information Overload ช่วยลดระยะเวลาในการทำงาน แล้วให้ผู้เชี่ยวชาญที่เป็นมนุษย์คอยรับเรื่องเฉพาะกรณีใหญ่ๆ เท่านั้น ผลพลอยได้ที่ตามมายังช่วยลด Human Error และช่วยให้อารมณ์ของพนักงานไม่ตึงเครียดหรือเหนื่อยล้าเกินไป

สำหรับข้อมูลที่ LLM ของ InnovestX นำมาใช้ จะเอามาจากบทวิเคราะห์ที่ทีมวิเคราะห์ของ InnovestX จัดทำขึ้น ทุกเปเปอร์จะมีการอ้างอิงว่า ข้อมูลที่นำมาใช้มีที่มาจากแหล่งใด เพื่อให้นักลงทุนเข้าไปอ่านเพิ่มเติมหากมีเวลา ช่วยเพิ่มความน่าเชื่อถือ และทำให้ลูกค้านักลงทุนมั่นใจว่า นักวิเคราะห์ไม่ได้คิดเลขขึ้นเองโดยไร้หลักการหรือหลักฐานยืนยัน

ไม่เพียงแค่นั้น การใช้โมเดลของ Typhoon ยังช่วยให้ InnovestX ประหยัดงบประมาณได้มากกว่า 10% เมื่อเทียบกับการใช้โมเดลอื่นๆ เช่น GPT4o และพนักงานสามารถตอบลูกค้าได้เร็วขึ้น ประหยัดเวลามากขึ้น มั่นใจมากขึ้นว่าจะสามารถส่งมอบคำแนะนำในการลงทุนที่มีคุณภาพไปถึงลูกค้าได้อย่างรวดเร็ว

ภายในงาน SCBX Unlocking AI ยังสาธิตการใช้งาน AI-Powered Digital RM แบบ Realtime ด้วย ทำให้เห็นว่า AI ของ InnovestX ทำงานอย่างไร ตอบสนองต่อข้อมูลที่ลูกค้าป้อนเข้ามาจริงอย่างไร เพื่อสร้างความรู้สึกดีๆ ให้ลูกค้าที่ใช้บริการ ทำให้พวกเขาลงทุนอย่างมีความสุขและประสบความสำเร็จต่อไป

หากใครสนใจ อยากรู้ว่าข้อมูลการลงทุนจาก InnovestX น่าเชื่อถือและไว้ใจได้จริงหรือไม่ สามารถลองทักแชทไปหา InnovestX ได้เลย 

Session 5: Advancing Thai LLMs and Their Applications 

งาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications นอกจากอัดแน่นไปด้วยการบรรยายถึง LLM ในแง่มุมที่น่าสนใจ ยังมีการเสวนาปิดท้ายด้วย ชื่อเดียวกับธีมงานเลยนั่นคือ Advancing Thai LLMs and Their Applications

งานนี้ได้รับเกียรติจากผู้เชี่ยวชาญที่มีประสบการณ์การศึกษาและพัฒนา LLM ในระดับชาติและในระดับโลก ประกอบด้วย ดร.เทพชัย ทรัพย์นิธิ Vice President, AiAT & Director of Artificial Intelligence Research จาก NECTEC, ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa, อ.ดร.เอกพล ช่วงสุวนิช จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย และคุณวีรินท์ ฉันทโรจน์ AI Transformation Lead จาก InnovestX

โดยมี ดร.ฐิติพัทธ อัชชะกุลวิสุทธิ์ อาจารย์ประจำภาควิชาวิศวกรรมชีวการแพทย์ คณะวิศวกรรมศาสตร์ มหาวิทยาลัยมหิดล ทำหน้าที่เป็นพิธีกร

สาระสำคัญของการเสวนาครั้งนี้มีเรื่องอะไรน่าสนใจบ้าง Insiderly ai สรุปมาแล้วดังนี้

  1. คุณวีรินท์ บอกว่า LLM สามารถเอามาใช้ในแวดวงการเงินได้หลายอย่าง นอกจากเอามาประมวลข้อมูลช่วยในการลงทุน ยังสามารถเอามาช่วยแก้หนี้เสียของผู้บริโภค, ลดค่าใช้จ่าย, ลดความเสี่ยง และช่วยปรับ Customer Experience ให้ดีขึ้นได้ เป็นต้น
  2. ส่วน ดร.เอกพล เล่าว่า LLM สามารถเอาไปใช้ในแวดวงวิชาการได้หลายอย่าง เพื่อดูแลนิสิตนักศึกษาให้ดีขึ้น พร้อมยกตัวอย่างว่าปัจจุบันมีจำนวนนิสิตในคณะเพิ่มขึ้นหลายเท่า แต่จำนวนอาจารย์ผู้สอนกลับไม่ได้เพิ่มขึ้นในอัตราส่วนเท่ากัน เขาจึงทดลองเอา LLM มาช่วยงาน เช่น เอามาช่วยตรวจข้อสอบด้วย 
  3. แต่พอลองเอามาตรวจข้อสอบก็พบว่า LLM ไม่ได้ให้คำตอบที่เที่ยงตรงมากเมื่อเทียบกับการตรวจเองด้วยมนุษย์ หากเอามาใช้อาจทำให้เกรดของนักศึกษาคลาดเคลื่อนได้ จึงเป็นสิ่งที่ต้องติดตามกันต่อไปว่า ในอนาคตจะสามารถพัฒนาระบบที่มีความเที่ยงตรงขึ้นมาช่วยงาน และแบ่งเบาภาระของคณาจารย์ได้อย่างไร
  4. ดร.เทพชัย เสริมว่าใน NECTEC เองก็เอา LLM มาใช้เช่นกัน แต่ใช้กับงานง่ายๆ เช่น เอามาใช้เป็น Chatbot คอยตอบคำถามเกี่ยวกับกฎระเบียบขององค์กร อาทิ วันหยุด วันลา สวัสดิการพนักงาน ซึ่งบางทีเขาก็ลองปรับเปลี่ยนวิธีคำถามให้ยากขึ้น อาจใส่สถานการณ์ที่ซับซ้อนเข้าไปเป็นตัวแปรเพื่อทดสอบว่า มันสามารถตอบคำถามที่พลิกแพลงไปจากที่เรียนรู้ได้แค่ไหน 
  5. ส่วน ศ.ดร.สรณะ ให้ข้อมูลเพิ่มเติมว่า ตอนนี้กำลังช่วยคณะนิติศาสตร์ มหาวิทยาลัยธรรมศาสตร์ ฝึกฝน LLM เพื่อให้ทำหน้าที่ผู้ช่วยนักกฎหมาย ทั้งนี้สาเหตุที่ไม่ฝึกให้มันเป็นทนาย เพราะยังไม่สามารถมั่นใจและพึ่งพาคำตอบของมันได้เต็มที่ว่ามีความเที่ยงตรงมากกว่าหรือเท่ากับการวินิจฉัยคดีของมนุษย์ ทำให้บทบาทของ LLM ในการเป็นผู้ช่วยนักกฎหมายตอนนี้จะยังจำกัดอยู่แค่การช่วยหาข้อมูล ช่วยสรุปข้อกฎหมาย และคาดว่าภายในเดือนกันยายนนี้จะนำเดโม่สาธิตการใช้งานออกมาให้ทุกคนได้รับชมกัน
  6. อีกสิ่งที่ ศ.ดร.สรณะ เน้นย้ำก็คือ คนทั่วไปยังเข้าใจผิดกันอยู่ว่า เราสามารถเอา LLM มาใช้งานเป็น Database สำหรับสืบค้นข้อมูลกันจริงๆ ได้เลย ซึ่งไม่ใช่ เพราะอย่าลืมว่าข้อมูลที่ได้ยังมีความคลาดเคลื่อน ผิดไปจากข้อเท็จจริงอยู่ หากใครจะใช้งานมันเป็นฐาน Database ต้องมีความเชี่ยวชาญจริงๆ ต้องรู้ว่าข้อมูลที่มันให้นั้นถูกหรือผิด และต้องตรวจสอบข้อมูลของมันอยู่เสมอด้วย
  7. ดร.เทพชัย บอกว่าการจะมี LLM ที่ดีที่ให้ข้อมูลถูกต้อง จำเป็นต้องมาจากการให้เรียนรู้ข้อมูลพื้นฐานที่ดีด้วย แต่เขายอมรับว่าปัจจุบันยังมีไม่กี่คนเท่านั้นที่สามารถฝึกฝน LLM แล้ว Fine Tuning คำตอบออกมาได้อย่างที่ตั้งใจไว้ ดังนั้นหากต้องการเห็นแวดวง AI พัฒนามากขึ้น ก็จำเป็นต้องเร่งเสริมสร้างบุคลากรขึ้นมาเพื่อช่วยยกระดับวงการให้มากขึ้นด้วย
  8. คุณวีรินท์ ยืนยันว่าการหาคนมาเสริมทีม AI Engineer นั้นยากจริงๆ ในกรณีของ InnovestX เจอปัญหาจากทั้งปัจจัยภายในและภายนอก โดยปัจจัยที่มีผลมากๆ ก็คือสภาพของตลาดหุ้นประเทศไทยเองที่ตอนนี้อยู่ในช่วงขาลง เมื่อเทียบกับประเทศอื่นๆ ที่เป็นช่วงขาขึ้น ทำให้ผู้คนสนใจข้อมูลจากหุ้นไทยน้อยลง แล้วพอคนสนใจน้อย เม็ดเงินที่จะเข้ามาสนับสนุนให้วงการเติบโตก็น้อยลงไปด้วย ไม่สามารถพัฒนาอย่างมีประสิทธิภาพได้
  9. ปัญหาเรื่องคนยังส่งผลให้ชุมชนของผู้คนในวงการพัฒนา AI ยังไม่แข็งแรงเท่าที่ควรคือเรื่องใหญ่ที่ทุกคนล้วนเจอ ดร.เอกพล เล่าว่าเคยเจอคนจากหลายองค์กรที่พยายามศึกษาและพัฒนา LLM ด้วยตัวเอง แต่พอต้องเรียนรู้เองก็มีค่าใช้จ่ายที่สูง และต้องเสียค่าลองผิดลองถูกที่แพงมาก นั่นทำให้เขายิ่งเห็นความสำคัญของงานเสวนาอย่าง SCBX Unlocking AI ว่าสามารถนำผู้คนที่มีความสนใจในสิ่งเดียวกันมาเจอกัน แล้วนำไปสู่การพัฒนาสิ่งที่ดีขึ้นพร้อมกันได้ และเราควรต้องมีพื้นที่แบบนี้เพิ่มขึ้น หากต้องการให้แวดวง AI พัฒนาขึ้นจริงๆ
Great! Next, complete checkout for full access to The Insiderly AI.
Welcome back! You've successfully signed in.
You've successfully subscribed to The Insiderly AI.
Success! Your account is fully activated, you now have access to all content.
Success! Your billing info has been updated.
Your billing was not updated.