دادگان ایجاد شده در آزمایشگاه
تشخیص پلاک
– حجم داده: ۱۵۰۰ نمونه
– منابع اخذ داده: پارکینگ یک سازمان، تصاویر موجود در اینترنت
– اهم ویژگیهای مدنظر در دادگان:
- فاصلههای مختلف هدف از دوربین
- تغییر زاویه چرخشی افقی و عمودی دوربین
- شرایط آبوهوایی مختلف
- تنوع وسیله نقلیه
- تاری ناشی از حرکت
بازشناسی چهره
– حجم داده: ۱۲۰۰ نمونه
– منابع دادگان: افراد داخل پژوهشگاه و تصاویر موجود در اینترنت
– اهم ویژگیهای مدنظر در دادگان:
- فاصله و ارتفاع دوربین
- تغییر زاویه چرخشی افقی و عمودی
- حالات مختلف چهره (شاد، غمگین و ...)
- زبان بدن
بازشناسایی گفتار
– حجم داده: ۲۹۷۹۲ ثانیه (حدود ۹ ساعت)
– تنوع دادگان: تاریخی، شخصیت، علمی تخیلی، مجموعه داستان
– اهم ویژگیهای مدنظر در دادگان:
- سبک گفتار، جنسیت، سن
- تعداد گویندگان
- دامنه و فرکانس صدا
- سطح نویز
- طول جمله
نویسه خوان نوری ( متن تایپی)
– حجم داده: ۴۰۰ نمونه
– تنوع دادگان: کتابها و مقالات، اسناد خبری، رسمی، تبلیغاتی
– اهم ویژگیهای مدنظر در دادگان:
- نوع سند و حالت قلم
- شرایط نورپردازی
- تنوع زبان
- پسزمینه تصاویر
- تضاد رنگ متن و پسزمینه
نویسه خوان نوری (متن دستنویس)
– حجم داده: ۵۰۰ نمونه
– تنوع دادگان: معمولی، تاریخی و قدیمی، انواع فرمها
– اهم ویژگیهای مدنظر در دادگان:
- نوع سند و نوع نوشتار
- تنوع سبک دستخط
- ابزار نوشتن و رنگ جوهر
- نوع کاغذ و کیفیت تصویر