คำอธิบาย
โปรแกรมตรวจจับวัตถุด้วย yolo
ในยุคดิจิทัลปัจจุบัน การตรวจจับวัตถุในภาพหรือวิดีโอเป็นหนึ่งในงานที่มีความสำคัญและมีการใช้งานอย่างกว้างขวาง ตั้งแต่การเฝ้าระวังความปลอดภัยไปจนถึงการวิเคราะห์และจำแนกวัตถุในระบบอัตโนมัติ YOLO (You Only Look Once) เป็นหนึ่งในเทคนิคที่ได้รับความนิยมสูงสำหรับการตรวจจับวัตถุเนื่องจากความเร็วและความแม่นยำสูงในการทำงาน บทความนี้จะแนะนำวิธีการใช้ Python และ YOLO สำหรับการตรวจจับวัตถุในวิดีโอสตรีม OpenCV (Open Source Computer Vision Library) พร้อมกับโค้ดรหัสตัวอย่างที่ใช้งานได้จริง
YOLO คืออะไร?
YOLO ย่อมากจาก “You Only Look Once” เป็นโมเดลอัลกอริทั่มในการตรวจจับวัตถุ
ที่ถูกสร้างขึ้นโดยนายJoseph Redmon
หลักการทำงานคร่าวๆของ YOLO คือการแบ่งภาพออกเป็นช่องๆขนาด N*N หละจะใช้อัลกอริทั่มคำนวนค่าความเป็นไปได้ของข่องนั้นๆ ว่าจะเป็นวัตถุที่อยู่ใน dataset หรือไม่
การตรวจจับวัตถุคืออะไร?
การตรวจจับวัตถุ หรือ Object Detection คือความสามารถในการตรวจจับวัตถุและบ่งบอกว่าวัตถุนั้นคืออะไรได้อย่างถูกต้อง
โดยเป็นหนึ่งในหน้าที่การทำงานของเทคโนโลยี Computer vision ที่จะทำการฝึกฝนระบบ AI คอมพิวเตอร์
ให้สามารถมองเห็นและเข้าใจในสิ่งที่มนุษย์สามารถทำได้ผ่านการรับค่ารูปภาพ วิดิโอต่างๆ โดยเป็น Object detection
นั้นเป็น Machine learning แบบ Deep learning เนื่องจากเป็นการสอนและฝึกฝนAI ให้ทำหน้าที่ได้เหมือนมนุษย์
โดย ณ ปัจจุบัน YOLO มีถึง Version 8 ในบทความนี้เราจะใช้ YOLOV5 โดยจะต่างกันตรง Feature ที่เพิ่มเข้ามาในเวอร์ชั่นหลังๆนั้นเอง
โปรแกรมที่ใช้
1. python
2. opencv