Alexa, Siri และ Google ไม่เข้าใจคำศัพท์ที่คุณพูด

อเมซอน

ผู้ช่วยด้านเสียงเช่น Alexa, Google Assistant และ Siri ได้เข้ามาเป็นจำนวนมากในช่วงไม่กี่ปีที่ผ่านมา แต่สำหรับการปรับปรุงทั้งหมดของพวกเขามีสิ่งหนึ่งที่ขัดขวางพวกเขา: พวกเขาไม่เข้าใจคุณ พวกเขาพึ่งพาคำสั่งเสียงที่เฉพาะเจาะจงมากเกินไป.

การรู้จำเสียงเป็นเพียงกลลวง

อเมซอน

ผู้ช่วยเสียงไม่เข้าใจคุณ ไม่ได้จริงๆ เมื่อคุณพูดกับ Google Home หรือ Amazon Echo คำหลักนั้นจะแปลงคำของคุณเป็นสตริงข้อความและเปรียบเทียบคำสั่งนั้นกับคำสั่งที่คาดหวัง หากพบว่ามีการจับคู่ที่ตรงกันก็จะทำตามคำแนะนำชุด หากไม่เป็นเช่นนั้นจะมองหาทางเลือกอื่นว่าจะทำอย่างไรโดยพิจารณาจากข้อมูลที่มีอยู่และหากไม่สามารถใช้งานได้คุณจะได้รับข้อความแสดงความล้มเหลวเช่น“ ฉันขอโทษ แต่ฉันไม่รู้ .” มันวิเศษไปกว่าความมหัศจรรย์ของมือเพียงเล็กน้อยที่จะหลอกให้คุณคิดว่ามันเข้าใจ.

ไม่สามารถใช้เบาะแสตามบริบทเพื่อคาดเดาที่ดีที่สุดหรือแม้แต่ใช้ความเข้าใจในหัวข้อที่คล้ายกันเพื่อแจ้งการตัดสินใจ มันก็ไม่ยากที่จะเดินทางไปยังผู้ช่วยด้านเสียง ในขณะที่คุณสามารถถาม Alexa“ คุณทำงานให้กับ NSA หรือไม่” และรับคำตอบถ้าคุณถาม“ คุณเป็นส่วนหนึ่งของ NSA หรือไม่” คุณได้รับการตอบกลับ“ ฉันไม่ทราบ” เวลาของการเขียนนี้).

มนุษย์ที่เข้าใจคำพูดอย่างแท้จริงไม่ทำงานเช่นนี้ สมมติว่าคุณถามมนุษย์“ อะไรคือสิ่งที่ klarvain ในท้องฟ้า? สิ่งที่โค้งและเต็มไปด้วยลายแถบสีเช่นสีแดงสีส้มสีเหลืองและสีฟ้า” ถึงแม้ klarvain จะเป็นคำที่แต่งขึ้น แต่คนที่คุณถามอาจจะคิดออกมาจากบริบทที่คุณอธิบายสายรุ้ง.

ในขณะที่คุณสามารถยืนยันว่ามนุษย์แปลงคำพูดให้เป็นความคิดมนุษย์ก็สามารถนำความรู้และความเข้าใจไปใช้เพื่อสรุปคำตอบ หากคุณถามมนุษย์ว่าพวกเขาแอบทำงานให้กับ NSA หรือไม่พวกเขาจะให้คำตอบใช่หรือไม่แม้ว่าคำตอบนั้นเป็นเรื่องโกหก มนุษย์คงไม่พูดว่า“ ฉันไม่รู้อันนั้น” กับคำถามแบบนั้น มนุษย์สามารถโกหกได้เป็นสิ่งที่มาพร้อมกับความเข้าใจที่แท้จริง.

ผู้ช่วยเสียงไม่สามารถไปไกลกว่าการเขียนโปรแกรม

ในที่สุดผู้ช่วยเสียงจะถูก จำกัด ตามพารามิเตอร์ที่ตั้งโปรแกรมไว้และการเดินไปข้างนอกจะทำให้กระบวนการแตกหัก ความจริงนั้นแสดงเมื่ออุปกรณ์ของบุคคลที่สามเข้ามาเล่น โดยปกติแล้วคำสั่งที่จะโต้ตอบกับสิ่งเหล่านั้นเป็นเรื่องที่เทอะทะมากซึ่งเป็นจำนวน“ บอกผู้ผลิตอุปกรณ์ให้สั่งอาร์กิวเมนต์ทางเลือก” ตัวอย่างที่แน่นอนคือ:“ บอก Whirlpool ให้หยุดเครื่องเป่าชั่วคราว” เพื่อให้จำตัวอย่างได้ยากยิ่งขึ้น ความสามารถในการควบคุมเตาอบ GE บางอย่าง ผู้ใช้ทักษะต้องจำไว้ว่า“ บอกเจนีวา” ไม่ใช่“ บอกจีอี” ตามด้วยคำสั่งที่เหลือ และในขณะที่คุณสามารถขอให้เปิดเตาอบที่ 350 องศาคุณจะไม่สามารถติดตามการร้องขอเพื่อเพิ่มอุณหภูมิอีก 50 องศา มนุษย์สามารถทำตามคำขอเหล่านี้ได้.

Amazon และ Google ทำงานอย่างหนักเพื่อเอาชนะอุปสรรคเหล่านี้และมันแสดงให้เห็น เมื่อคุณต้องทำตามลำดับข้างต้นเพื่อควบคุมสมาร์ทล็อคตอนนี้คุณสามารถพูดว่า "ล็อคประตูหน้า" แทน Alexa เคยสับสนโดย“ บอกเรื่องตลกกับสุนัข” แต่ขอหนึ่งวันนี้และมันจะใช้ได้ พวกเขาได้เพิ่มรูปแบบต่าง ๆ ให้กับคำสั่งที่คุณใช้ แต่ท้ายที่สุดคุณยังต้องรู้คำสั่งที่ถูกต้อง คุณต้องใช้ไวยากรณ์ที่ถูกต้องตามลำดับที่ถูกต้อง.

และถ้าคุณคิดว่าฟังดูเหมือนบรรทัดคำสั่งคุณจะไม่ผิด.

ผู้ช่วยเสียงเป็นบรรทัดคำสั่งแฟนซี

Command Line นั้นถูกกำหนดไว้อย่างแคบ ๆ เพื่อทำงานง่ายๆ แต่ถ้าคุณรู้ไวยากรณ์ที่เหมาะสม หากคุณเลื่อนออกจากไวยากรณ์ที่ถูกต้องและพิมพ์ dyr แทน dir แล้วพรอมต์คำสั่งจะให้ข้อความผิดพลาด คุณสามารถใช้นามแฝงเพื่อจดจำคำสั่งได้ง่ายขึ้น แต่คุณต้องทราบว่าคำสั่งดั้งเดิมนั้นทำงานอย่างไรและใช้นามแฝงอย่างไร หากคุณไม่ได้ใช้เวลาในการเรียนรู้อินและนอกบรรทัดคำสั่งคุณจะไม่ได้รับประโยชน์อะไรมากมาย.

ผู้ช่วยเสียงไม่แตกต่างกัน คุณจำเป็นต้องรู้วิธีที่ถูกต้องในการพูดคำสั่งหรือถามคำถาม และคุณจำเป็นต้องรู้วิธีตั้งค่ากลุ่มสำหรับ Google และ Alexa ทำไมการจัดกลุ่มอุปกรณ์ของคุณจึงมีความสำคัญและวิธีตั้งชื่ออุปกรณ์สมาร์ทของคุณ หากคุณไม่ทำตามขั้นตอนที่จำเป็นเหล่านี้คุณจะรู้สึกหงุดหงิดกับการขอให้ผู้ช่วยเสียงของคุณปิดการศึกษาเท่านั้นที่จะถูกถาม“ การศึกษาใด” ที่ควรถูกปิด.

แม้ว่าคุณจะใช้ไวยากรณ์ที่ถูกต้องในลำดับที่ถูกต้องกระบวนการอาจล้มเหลว อาจเกิดจากการตอบสนองที่ผิดหรือผลลัพธ์ที่น่าประหลาดใจ Google Homes สองแห่งในบ้านเดียวกันอาจให้สภาพอากาศในสถานที่ต่างกันเล็กน้อยแม้ว่าพวกเขาจะสามารถเข้าถึงข้อมูลบัญชีผู้ใช้และการเชื่อมต่ออินเทอร์เน็ตเดียวกันได้.

ในตัวอย่างข้างต้นคำสั่ง“ กำหนดตัวจับเวลาเป็นเวลาครึ่งชั่วโมง” จะได้รับ ฮับหน้าแรกของ Google สร้างตัวจับเวลาชื่อ“ ชั่วโมง” และถามว่าควรจับเวลานานเท่าใด และยังทำซ้ำคำสั่งเดียวกันอีกสามครั้งทำงานอย่างถูกต้องและสร้างตัวจับเวลา 30 นาที การใช้คำสั่ง“ ตั้งเวลา 30 นาที” ทำงานอย่างถูกต้องบนพื้นฐานที่สอดคล้องกันมากขึ้น.

ในขณะที่การพูดคุยกับ Google Home หรือ Echo อาจมีความคล่องแคล่วมากขึ้นภายใต้ผู้ช่วยเสียงและกระโปรงบรรทัดคำสั่งทำงานในลักษณะเดียวกัน คุณอาจไม่จำเป็นต้องเรียนรู้ภาษาใหม่ แต่คุณต้องเรียนรู้ภาษาใหม่.

ความเข้าใจที่แคบของผู้ช่วยเสียงจะ จำกัด การเติบโต

สิ่งนี้ไม่ช่วยป้องกันเสียงเช่น Google Assistant และ Alexa ทำงานได้ดีพอ (แม้ว่า Cortana จะแตกต่างกัน) Google Assistant และ Alexa และค้นหาคำถามออนไลน์อย่างเหมาะสม แต่ไม่น่าแปลกใจที่ Google ค้นหาได้ดีกว่าและสามารถตอบคำถามพื้นฐานเช่นการวัดการแปลงและคณิตศาสตร์ง่ายๆ ด้วยการตั้งค่าสมาร์ทโฮมอย่างถูกต้องและผู้ใช้ที่ผ่านการฝึกอบรมมาอย่างดีคำสั่งสมาร์ทโฮมส่วนใหญ่จะทำงานได้ตามที่ต้องการ แต่สิ่งนี้เกิดจากการทำงานและความพยายามไม่ใช่ความเข้าใจอย่างฉลาด.

ตัวจับเวลาและการเตือนเคยเป็นเรื่องง่าย เมื่อเวลาผ่านไปเพิ่มชื่อแล้วความสามารถในการเพิ่มเวลาในการจับเวลา พวกเขาย้ายจากง่ายไปซับซ้อน ผู้ช่วยเสียงสามารถตอบคำถามได้มากขึ้นและในแต่ละวันจะมีทักษะและคุณสมบัติใหม่ ๆ แต่นั่นไม่ใช่ผลผลิตของการเติบโตด้วยตนเองที่มาจากการเรียนรู้และความเข้าใจ.

และไม่มีสิ่งใดที่ให้ความสามารถโดยธรรมชาติในการใช้สิ่งที่เป็นที่รู้จักเพื่อเข้าถึงสิ่งที่ไม่รู้จัก สำหรับทุกคำสั่งและคำถามที่ใช้งานได้จะมีสามสิ่งที่ไม่สามารถทำได้ โดยไม่มีการพัฒนาใน A.I ที่ให้ความสามารถเหมือนมนุษย์ในการทำความเข้าใจผู้ช่วยด้านเสียงไม่ใช่ผู้ช่วยเลย มันเป็นเพียงบรรทัดคำสั่งเสียงที่มีประโยชน์ในสถานการณ์ที่ถูกต้อง แต่ จำกัด เฉพาะสถานการณ์ที่พวกเขาได้รับการตั้งโปรแกรมให้เข้าใจ.

กล่าวอีกนัยหนึ่ง: เครื่องจักรกำลังเรียนรู้สิ่งต่าง ๆ แต่ไม่สามารถเข้าใจได้.