شرکت دانشبانیان پارت برای اولین بار در کشور مدل بزرگ BERT فارسی زبان را تحت عنوان «توکا» در قالب متن باز ارائه کرد تا علاقه مندان به توسعه ابزارهای هوشمند به صورت رایگان به آن دسترسی داشته باشند. این مجموعه علاوه بر نسخه بزرگ این مدل زبان، نسخه پایه خود را نیز به صورت متن باز در اختیار علاقه مندان قرار داد تا پیشرفت تمامی فعالان این عرصه هموار شود.

دقت و کیفیت مدل «توکا» که با حجم داده 500 گیگابایتی معادل 90 میلیارد توکن توسعه یافته بود، آن را به گزینه ای مؤثر برای پیاده سازی خدمات فارسی زبان تبدیل کرد. علاوه بر این، توانایی اجرا و آموزش این مدل بر روی سخت‌افزار کم‌قدرت، آن را به انتخاب خوبی برای محققان، توسعه‌دهندگان، برنامه‌نویسان و استارت‌آپ‌های هوش مصنوعی تبدیل می‌کند.

انتشار نسخه متن باز این مدل زبانی این امکان را برای شرکت ها و توسعه دهندگان حوزه هوش مصنوعی فراهم می کند تا بتوانند به راحتی مدل های زبان بزرگ را با استفاده از مدل پایه «توکا» آموزش و توسعه دهند و از سوی دیگر با تکیه بر آن، محصولات شخصی، هوشمندانه و کاملاً مطابق با نیازها و نیازهای مخاطبان خود طراحی و ارائه کنند.

مدل فارسی زبان «توکا» قبلاً در بسیاری از محصولات هوشمند و خدمات تعاملی شرکت پارت از جمله خدمات هوشمند ابری سوهاب، سرویس صوتی به متن «آوانگار»، سرویس تبدیل متن به گفتار «آواشو»، «دانابات» چت بات هوشمند. و «سرویس تبدیل تصویر به متن وونگار» از این جهت که زمینه استفاده از ابزارهای هوشمند و تعامل راحت‌تر و رضایت‌بخش‌تر با محصولات هوشمند را برای میلیون‌ها کاربر فارسی‌زبان ایران فراهم کرده است، مورد استفاده قرار گرفته و عملکرد خوبی از خود نشان داده است.