Google นำเสนอชุดข้อมูลเมตาดาต้าฟรีพร้อมอัลกอริธึม AI สำหรับการเรียนรู้เชิงลึกเพียงไม่กี่ภาพและอัลกอริทึมการเรียนรู้ของเครื่องเพื่อการจำแนกภาพที่รวดเร็วและมีประสิทธิภาพใน TensorFlow และ PyTorch

เทคโนโลยี / Google นำเสนอชุดข้อมูลเมตาดาต้าฟรีพร้อมอัลกอริธึม AI สำหรับการเรียนรู้เชิงลึกเพียงไม่กี่ภาพและอัลกอริทึมการเรียนรู้ของเครื่องเพื่อการจำแนกภาพที่รวดเร็วและมีประสิทธิภาพใน TensorFlow และ PyTorch อ่าน 2 นาที

Google Pixel 5?



Google มี ประกาศความพร้อมใช้งานของชุดข้อมูลหลายชุด ประกอบด้วยภาพธรรมชาติที่หลากหลาย แต่มีข้อ จำกัด ยักษ์ใหญ่ด้านการค้นหามั่นใจว่าข้อมูลที่เปิดเผยต่อสาธารณะจะผลักดันให้เกิด การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ ในขณะที่ลดเวลาในการฝึกโมเดล AI ด้วยข้อมูลจำนวนน้อยที่สุด Google เรียกโครงการริเริ่มใหม่ว่า 'Free Meta-Datasets' ซึ่งจะช่วยให้โมเดล AI 'เรียนรู้' โดยใช้ข้อมูลน้อยลง 'Few-Shot AI' จาก บริษัท ได้รับการปรับให้เหมาะสมเพื่อให้แน่ใจว่า AI เรียนรู้คลาสใหม่ ๆ จากภาพตัวแทนเพียงไม่กี่ภาพ

เมื่อเข้าใจถึงความจำเป็นในการฝึกโมเดล AI และ Machine Learning อย่างรวดเร็วด้วยชุดข้อมูลที่น้อยลง Google ได้เปิดตัว 'Meta-Dataset' ซึ่งเป็นคอลเล็กชันภาพขนาดเล็กที่จะช่วยลดปริมาณข้อมูลที่จำเป็นในการปรับปรุงความแม่นยำของอัลกอริทึม บริษัท อ้างว่าการใช้เทคนิคการจัดประเภทภาพไม่กี่ช็อตโมเดล AI และ ML จะได้รับข้อมูลเชิงลึกเดียวกันจากภาพตัวแทนจำนวนน้อยกว่ามาก



Google AI ประกาศ Meta-Dataset: ชุดข้อมูลสำหรับการเรียนรู้แบบ Few-Shot:

Deep Learning สำหรับ AI และ Machine Learning มีการเติบโตอย่างทวีคูณมาระยะหนึ่งแล้ว อย่างไรก็ตามข้อกำหนดหลักคือความพร้อมใช้งานของข้อมูลคุณภาพสูงและในปริมาณมากเกินไป ข้อมูลการฝึกอบรมที่ใส่คำอธิบายประกอบด้วยตนเองจำนวนมากมักเป็นเรื่องยากในการจัดหาและบางครั้งอาจไม่น่าเชื่อถือเช่นกัน เมื่อเข้าใจถึงความเสี่ยงของชุดข้อมูลขนาดใหญ่ Google ได้ประกาศความพร้อมใช้งานของชุดข้อมูลเมตา



ผ่าน“ Meta-Dataset: ชุดข้อมูลของชุดข้อมูลสำหรับการเรียนรู้เพื่อเรียนรู้จากตัวอย่างน้อย ๆ ” (นำเสนอที่ ICLR 2020 ) Google ได้เสนอเกณฑ์มาตรฐานขนาดใหญ่และหลากหลายสำหรับการวัดความสามารถของรูปแบบการจัดหมวดหมู่ภาพที่แตกต่างกันในการตั้งค่าไม่กี่ช็อตที่สมจริงและท้าทายโดยนำเสนอกรอบที่เราสามารถตรวจสอบประเด็นสำคัญหลายประการของการจัดประเภทไม่กี่ช็อต โดยพื้นฐานแล้ว Google นำเสนอชุดข้อมูลรูปภาพธรรมชาติ 10 ชุดที่เผยแพร่สู่สาธารณะและใช้งานได้ฟรี ชุดข้อมูลเหล่านี้ประกอบด้วย ImageNet, CUB-200-2011, Fungi, อักขระที่เขียนด้วยลายมือและดูเดิล รหัสคือ สาธารณะ และรวมถึงไฟล์ สมุดบันทึก ที่แสดงให้เห็นว่าสามารถใช้ Meta-Dataset ได้อย่างไร TensorFlow และ PyTorch .



การจัดประเภทไม่กี่ช็อตไปไกลกว่า การฝึกอบรมมาตรฐานและแบบจำลองการเรียนรู้เชิงลึก . ต้องใช้ลักษณะทั่วไปของชั้นเรียนใหม่ทั้งหมดในเวลาทดสอบ กล่าวอีกนัยหนึ่งไม่เห็นภาพที่ใช้ในระหว่างการทดสอบในการฝึกอบรม ในการจำแนกประเภทไม่กี่ช็อตชุดการฝึกประกอบด้วยชั้นเรียนที่ไม่ปะติดปะต่อจากที่จะปรากฏในเวลาทดสอบ แต่ละงานทดสอบประกอบด้วยไฟล์ ชุดสนับสนุน ภาพที่มีป้ายกำกับสองสามภาพซึ่งโมเดลสามารถเรียนรู้เกี่ยวกับคลาสใหม่และการไม่ปะติดปะต่อกัน ชุดแบบสอบถาม ของตัวอย่างที่โมเดลถูกขอให้จัดประเภท

Meta-Dataset เป็นส่วนประกอบที่มีขนาดใหญ่ แบบจำลองศึกษาลักษณะทั่วไปของชุดข้อมูลใหม่ทั้งหมด ซึ่งไม่เห็นภาพของชั้นเรียนใด ๆ ในการฝึกอบรม นี่เป็นนอกเหนือจากความท้าทายในการวางนัยทั่วไปที่ยากลำบากสำหรับชั้นเรียนใหม่ที่มีอยู่ในการตั้งค่าการเรียนรู้เพียงไม่กี่ช็อต

Meta-Dataset ช่วยการเรียนรู้เชิงลึกสำหรับโมเดล AI และ Machine Learning อย่างไร

Meta-Dataset แสดงถึงเกณฑ์มาตรฐานที่มีการจัดระเบียบขนาดใหญ่ที่สุดสำหรับชุดข้อมูลข้ามการจัดประเภทภาพไม่กี่ภาพจนถึงปัจจุบัน นอกจากนี้ยังแนะนำอัลกอริธึมการสุ่มตัวอย่างสำหรับการสร้างงานที่มีลักษณะและความยากที่แตกต่างกันโดยการเปลี่ยนจำนวนคลาสในแต่ละงานจำนวนตัวอย่างที่มีอยู่ต่อคลาสการแนะนำความไม่สมดุลของคลาสและสำหรับชุดข้อมูลบางชุดซึ่งจะทำให้ระดับความคล้ายคลึงกันระหว่าง ชั้นเรียนของแต่ละงาน



Meta-Dataset นำเสนอความท้าทายใหม่สำหรับการจำแนกประเภทไม่กี่ช็อต การวิจัยของ Google ยังคงเป็นข้อมูลเบื้องต้นและมีพื้นฐานมากมายที่จะครอบคลุม อย่างไรก็ตามยักษ์ใหญ่ด้านการค้นหาอ้างว่านักวิจัยประสบความสำเร็จ ตัวอย่างที่โดดเด่นบางส่วน ได้แก่ การใช้การออกแบบอย่างชาญฉลาด งาน เครื่องปรับอากาศ ซับซ้อนมากขึ้น การปรับแต่งไฮเปอร์พารามิเตอร์ , ถึง ' meta-baseline ’ที่รวมประโยชน์ของการฝึกอบรมก่อนและการเรียนรู้เมตาและสุดท้ายใช้ การเลือกคุณสมบัติ เชี่ยวชาญการเป็นตัวแทนสากลสำหรับแต่ละงาน

แท็ก google