คำนำโดยผู้เขียน

หนังสือเล่มนี้เกิดขึ้นในช่วงเวลาว่าง ขณะที่ผมทำหน้าที่เป็นนักสถิติในงานวิจัยทางการแพทย์ และเพราะผมทำงาน 4 วันต่อสัปดาห์ เลยมี "วันว่าง" พอให้ทำงานนอก (side project) จนมาถึงจุดหนึ่ง จักรกลเรียนรู้แบบแปลความได้กลายเป็นงานนอกงานหนึ่งของผม

และถ้าจะให้เล่ากันแบบตรงๆ ผมไม่มีเจตนาในการเขียนหนังสือเล่มนี้ แต่ว่าผมสนใจเรื่องราวของนักรกลเรียนรู้แบบแปลความได้ และหาแหล่งข้อมูลดีๆ ที่จะสามารถเรียนรู้เรื่องนี้ได้ แต่ผมเจอแค่งานวิจัย กับบล็อกโพสต์ที่กระจัดกระจายไปตามเว็บต่างๆ ในอินเทอร์เน็ต โดยไม่มีที่ไหนที่มีงานเขียน (ไม่ว่าจะเป็นหนังสือ บทความสอนทำตาม หรืองานวิจัย) ที่บอกเล่าเรื่องราวเกี่ยวกับภาพรวมของจักรกลเรียนรู้แปลความได้เลย และเป็นช่องว่างนี้เองที่ทำให้ผมเริ่มเขียนหนังสือเล่มนี้ โดยมีความคาดหวังให้เป็นหนังสือแบบที่ผมอยากอ่านตอนที่ผมกำลังศึกษาเรื่องจักรกลเรียนรู้แปลความได้ กล่าวคือหนังสือเล่มนี้มีความตั้งใจสองอย่างแฝงอยู่ หนึ่ง คือเพื่อให้ตัวเองได้เรียนรู้ และสอง เพื่อแบ่งปันสิ่งที่ตัวเองได้เรียนรู้ให้คนอื่น

ผมจบการศึกษาระดับปริญญาตรีและปริญญาโทด้านสถิติจาก LMU Munich, เยอรมนี ผมเรียนรู้ด้านจักรกลเรียนรู้ด้วยตัวเอง ส่วยมากผ่านคอร์สเรียนออนไลน์ โครงงานที่ทำยามว่าง และผ่านการทำงาน ความรู้สถิติที่ผมมีมาก่อนหน้านี้เป็นพื้นชั้นเยี่ยมในการต่อยอดไปเรียนด้านจักรกลเรียนรู้ โดยเฉพาะในเรื่องของจักรกลเรียนรู้แบบแปลความได้ เพราะว่าในศาสตร์ของสถิติสนใจการสร้างแบบจำลองการถดถอย (regression model) ที่สามารถแปลความได้

หลังเรียนจบปริญญาโท ผมไม่คิดจะเรียนต่อปริญญาเอก เพราะผมไม่ค่อยมีความสุขกับการเขียนวิทยานิพนธ์ระดับปริญญาโทเนื่องด้วยความกดดัน ผมจึงเลือกรับตำแหน่งนักวิทยาศาสตร์ข้อมูลในบริษัทสตาร์ทอัปด้านเทคโนโลยีการเงิน (Fintech) และตำแหน่งนักวิจัยในงานวิจัยทางการแพทย์ หลังจากทำงานสามปี ผมตัดสินใจเขียนหนังสือเล่มนี้ และหลังจากนั้นไม่นานผมเลือกเรียนต่อปริญญาเอกด้านแบบจำลองการเรียนรู้แปลความได้ หนังสือเล่มนี้ทำให้ผมกลับมาสนุกกับการเขียน และช่วยสร้างความมุ่งมั่นให้ตัวเองในด้านการวิจัย

หนังสือเล่มนี้กล่าวถึงวิธีการจำนวนมากที่จะใช้ในการตีความแบบจำลองจักรกลเรียนรู้ ในบทแรกๆ ของหนังสือ ผมเขียนอธิบายแนวคิดเบื้องต้นของการตีความได้ และชี้ให้เห็นถึงความจำเป็นที่เราต้องมีแบบจำลองที่ตีความได้ มีเรื่องเล่าเล็กๆ แทรกในบทต่างๆ ด้วยนะ หนังสือเล่มนี้จะพูดคุยถึงความแตกต่างของคุณสมบัติในคำอธิบายของแบบจำลองควบไปกับเหตุผลว่าทำไมมนุษย์ถึงคิดว่าคำอธิบายเหล่านั้นเป็นคำอธิบายที่ดี ตามด้วยแบบจำลองจักรกลเรียนรู้ที่แปลความได้เลย [แบบจำลองที่แปลความได้โดยไม่ต้องใช้ขั้นตอนวิธีอื่นเข้าช่วย: ผู้แปล] เช่นแบบจำลองการถดถอย (regression model) และต้นไม้ตัดสินใจ (decision tree)

ถัดมา หนังสือเล่มนี้จะกล่าวถึงขั้นตอนวิธีแปลความที่ไม่ขึ้นกับแบบจำลองโดยหลัก ขั้นตอนวิธีเหล่านี้สามารถใช้แปลความแบบจำลองชนิดใดก็ได้ และใช้แปลความหลังจากแบบจำลองถูกฝึกสอนสำเร็จแล้ว ซึ่งขั้นตอนวิธีการแปลความในกลุ่มนี้บางส่วนจะให้ผลการแปลความรายจุด [กล่าวคือสำหรับจุดข้อมูล (instance) จุดใดจุดหนึ่งถูกแบบจำลองคาดเดาผลลัพธ์ออกมาเป็นคำตอบนั้นเพราะเหตุใด: ผู้แปล] เช่นขั้นตอนวิธี local interpretable model-agnostic explanations (LIME) และ Shapley Values ในขณะที่ขั้นตอนวิธีอีกกลุ่มจะใช้อธิบายพฤติกรรมของแบบจำลองโดยรวมบนชุดข้อมูลทั้งชุด เช่น partial dependence plot, accumulated local effects, permutation feature importance และวิธีการอื่นๆ นอกจากนี้แล้วยังมีคำอธิบายอีกตระกูลหนึ่งที่สร้างจุดของข้อมูลที่ทำหน้าที่เป็นคำอธิบาย ซึ่งในหนังสือเล่มนี้ยกตัวอย่างขั้นตอนวิธีตระกูลนี้ เช่นคำอธิบายแบบโต้ข้อเท็จจริง (counterfactual examples), โปรโตไทป์ (prototypes), influential instances และตัวอย่างเชิงประสงค์ร้าย (adversatial example) และสุดท้ายหนังสือเล่มนี้จะจบลงด้วยการมองไปยังอนาคตข้างหน้าว่าการแปลความแบบจำลองจักรกลเรียนรู้จะมีหน้าตาอย่างไร

คุณไม่จำเป็นต้องอ่านหนังสือเล่มนี้จากหน้าแรกถึงหน้าสุดท้าย โดยคุณสามารถอ่านแบบกระโดดไปกระโดดมาตามหัวข้อที่คุณสนใจได้เลย อย่างไรก็ดีผมจะแนะนำให้เริ่มอ่านบทนำและหัวข้อว่าด้วยการแปลความได้เป็นอันดับแรก แต่หลังจากนั้นแต่ละบทของหนังสือจะว่าด้วยขั้นตอนวิธีแปลความซึ่งต่างกันไป

สำหรับแต่ละหัวข้อของหนังสือ ย่อหน้าแรกของหัวข้อจะกล่าวถึงขั้นตอนวิธีแปลความที่เรากำลังจะพูดถึงในหัวข้อนั้นโดยสรุป ก่อนจะอธิบายแนวคิดของขั้นตอนวิธีโดยไม่ยุ่งเกี่ยวกับสมการคณิตศาสตร์ หลังจากนั้นเป็นต้นไปจะเป็นการอธิบายทฤษฎีที่อยู่เบื้องหลังเพื่อสร้างความเข้าใจเชิงลึก และเราจะไม่ละทิ้งคณิตศาสตร์และทฤษฎีออกจากหนังสือนี้

ผมเชื่อว่าการเรียนรู้ที่ดีที่สุดคือการทำให้เห็นตัวอย่าง ดังนั้นขั้นตอนวิธีแต่ละขั้นตอนในหนังสือนี้จะถูกทดลองนำไปใช้กับข้อมูลจริง หลายคนชอบบอกว่านักสถิติเป็นพวกชอบวิจารณ์ ซึ่งผมว่าจริง เพราะแต่ละบทในหนังสือนี้ล้วนเต็มไปด้วยคำวิจารณ์ถึงข้อดีและข้อเสียของทุกขั้นตอนวิธีในหนังสือนี้ หนังสือเล่มนี้ไม่ได้เขียนเพื่อโฆษณาขั้นตอนวิธีใดๆ แต่เขียนขึ้นเพื่อช่วยให้คุณสามารถเลือกได้ว่าขั้นตอนวิธีชิ้นใดชิ้นหนึ่งจะทำงานได้ดีหรือไม่กับงานที่คุณกำลังทำ ในหัวข้อสุดท้ายของแต่ละบท เราจะคุยกันถึงซอฟต์แวร์สำหรับการแปลความแบบจำลองด้วยขั้นตอนวิธีที่เราพูดถึงในบทนั้นๆ

จักรกลเรียนรู้ได้รับความสนใจจากผู้คนจำนวนมาก ทั้งในงานเชิงอุตสาหกรรมและงานวิจัย บางครั้งจักรกลเรียนรู้ก็ถูกอวยยศเสียจนยิ่งใหญ่เกินไป แต่ตัวของมันเองถูกนำมาใช้ในชิ้นงานที่มีความสำคัญจริงๆ จักรกลเรียนรู้เป็นเทคโนโลยีที่ทรงพลังในการสร้างผลิตภัณฑ์ งานวิจัย และการสร้างระบบบอัตโนมัติ งานจำนวนมากในปัจจุบัน เช่นการตรวจจับธุรกรรมที่น่าสงสัย การแนะนำภาพยนตร์ที่น่าชม และการจำแนกรูปภาพ ล้วนใช้พลังของจักรกลเรียนรู้ และส่วนใหญ่ผลการตัดสินใจของจักรกลเรียนรู้ต้องสามารถแปลความได้ เพื่อให้นักพัฒนาจักรกลเรียนรู้แก้ไขและปรับปรุงแบบจำลอง เพื่อให้สาธารณะชนมีความเชื่อมั่นในแบบจำลอง รวมถึงเพื่อตัดสินความน่าเชื่อถือของแบบจำลองและเข้าใจการทำงานของแบบจำลองมากขึ้น

ความจำเป็นที่เราต้องมีจักรกลเรียนรู้ที่แปลความได้เพิ่มขึ้นตามกาลเวลา ก็เพราะว่าการใช้งานจักรกลเรียนรู้เพิ่มขึ้นตามกาลเวลาเช่นกัน หนังสือเล่มนี้กลายเป็นแหล่งข้อมูลที่มีค่าสำหรับคนจำนวนมาก เช่นครูหรืออาจารย์ที่ใช้หนังสือเล่มนี้เพื่อแนะนำให้นักเรียนรู้จักแนวคิดของการแปลความได้ ผมได้รับอีเมลจำนวนมากจากนักเรียนปริญญาโทและปริญญาเอกที่บอกว่าหนังสือเล่มนี้เป็นแหล่งข้อมูลเริ่มต้นที่ดีในการเขียนวิทยานิพนธ์ รวมถึงว่าหนังสือเล่มนี้ช่วยบุคลากรในสายงานอื่นๆ (เช่นนิเวศวิทยา การเงิน จิตวิทยา ฯลฯ) ที่นำจักรกลเรียนรู้มาใช้ นักวิทยาศาสตร์ข้อมูลบางคนบอกว่าเขาแนะนำหนังสือเล่มนี้ในการอ่านประกอบการทำงาน รวมถึงแนะนำให้เพื่อนร่วมงานอ่าน ผมมีความสุขมากที่ผู้คนหยิบหนังสือเล่มนี้ไปใช้จนเกิดประโยชน์กับตัวเอง และบางคนใช้ในการต่อยอดจนกลายเป็นหนึ่งในผู้เชี่ยวชาญด้านการแปลความแบบจำลองจักรกลเรียนรู้

ผมแนะนำหนังสือเล่มนี้ให้กับผู้มุ่งประยุกต์ใช้งานเทคนิกการแปลความจักรกลเรียนรู้ เพื่อให้เข้าใจภาพรวมของเทคนิกต่างๆ และหยิบวิธีการที่เหมาะสมไปใช้ นอกจากนี้หนังสือเล่มนี้ยังเหมาะกับนักเรียน นักวิจัย (และใครก็ได้) ที่สนใจหัวข้อของหนังสือ ในการอ่านหนังสือให้ได้ประโยชน์สูงสุด คุณควรมีความเข้าใจเบื้องต้นของจักรกลเรียนรู้ ตลอดจนความรู้คณิตศาสตร์ระดับมหาวิทยาลัยเบื้องต้น เพื่อที่จะอ่านหนังสือเล่มนี้แล้วสามารถเข้าใจทฤษฎีและสมการต่างๆ ได้ อย่างไรก็ตาม หนังสือเล่มนี้มีคำอธิบายแนวคิดเบื้องต้นแบบตรงไปตรงมาของวิธีการแปลความแต่ละวิธี ที่ควรจะทำให้พอเห็นภาพได้โดยไม่ต้องมีความรู้คณิตศาสตร์แต่อย่างใด

ขอให้สนุกกับการอ่านครับ!่