DeepSeek چه هست؟ نگاهی به چتباتی که غولهای فناوری را به امتحان گذاشت

به نقل از ایتنا و بر اساس گزارشی از تککرانچ، موفقیت این مدلها که به واسطه روشهای محاسباتی نوین به بار نشستهاند، بررسیگران والاستریت و فعالان بخش فناوری را به تأمل واداشته است که آیا ایالات متحده قادر به حفظ برتری تاریخی خود در عرصه هوش مصنوعی خواهد بود و آیا تقاضا برای تراشههای مرتبط با این فناوری میتواند ادامه یابد یا خیر.
اما دیپسیک چگونه شکل گرفت و توانسته است در زمان نسبتاً کوتاهی به چنین شهرتی برسد؟
پایهگذاری دیپسیک در دنیای معاملات
دیپسیک تحت حمایت شرکت مدیریت سرمایه High-Flyer، که یکی از صندوقهای پوشش ریسک کمی در چین میباشد و از هوش مصنوعی برای تصمیمگیریهای تجاری خود بهره میبرد، فعالیت میکند.
«لیانگ ونفنگ»، بنیانگذار این شرکت، با علاقه به حوزه هوش مصنوعی، High-Flyer را در سال ۲۰۱۵ تأسیس نمود. او از دوران دانشجویی خود در دانشگاه ژجیانگ به فعالیت در زمینه معاملات پرداخت و در سال ۲۰۱۹، مدیریت High-Flyer Capital Management را با رویکردی متمرکز بر توسعه الگوریتمهای هوش مصنوعی آغاز کرد.
در سال ۲۰۲۳، شرکت High-Flyer اقدام به تأسیس آزمایشگاه دیپسیک کرد؛ نهادی مستقل برای تحقیق و توسعه ابزارهای هوش مصنوعی که به فعالیتهای مالی این شرکت وابسته نبود. با حمایت مالی High-Flyer، دیپسیک به شرکتی مستقل در عرصه فناوری بدل شد.
این نهاد از همان آغاز به ایجاد زیرساختهای مخصوص به خود جهت آموزش مدلهای هوش مصنوعی پرداخت. البته، مشابه دیگر شرکتهای فعال در این حوزه در چین، دیپسیک نیز از محدودیتهای صادراتی ایالات متحده در زمینه سختافزار آسیب دید و برای آموزش مدلهای جدید ناچار به استفاده از تراشههای ضعیفتر Nvidia H800 (نسخهای محدودتر از H100 که در اختیار شرکتهای آمریکایی است) شد.
گزارشها حاکی از آن است که تیم فنی دیپسیک عمدتاً شامل افرادی جوان است و این شرکت به طرز ویژهای بر جذب پژوهشگران دکتری از دانشگاههای معتبر چین تمرکز دارد. بر اساس گزارشی از نیویورکتایمز، دیپسیک حتی افرادی را با سوابق غیررایانه جذب میکند تا تنوع موضوعی و رویکردی چندرشتهای را در توسعه فناوری خود افزایش دهد.
مدلهای پیشرفته DeepSeek
دیپسیک اولین مجموعه مدلهای خود شامل DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را در آبان ماه ۱۴۰۲ (نوامبر ۲۰۲۳) رونمایی کرد. اما جلب توجه گسترده صنعت هوش مصنوعی زمانی به وقوع پیوست که این شرکت در بهار گذشته نسل دوم مدلهای خود تحت عنوان DeepSeek-V2 را معرفی نمود.
مدل DeepSeek-V2 با قابلیت تحلیل توأم متن و تصویر، در آزمونهای متعدد عملکرد باورنکردنی از خود ارائه داد. هزینه کم راهاندازی آن نسبت به مدلهای مشابه، موجب شد رقبا از جمله ByteDance و Alibaba قیمت برخی از مدلهای خود را کاهش دهند و حتی مدلهایی را به صورت رایگان عرضه کنند.
مدل DeepSeek-V3 که در آذرماه ۱۴۰۳ معرفی شد، در ارتقاء شهرت این شرکت نیز تأثیر بسزایی داشت. ارزیابیهای داخلی نشان میدهد که این مدل عملکرد بهتری نسبت به مدلهای متنباز مانند Llama از Meta و حتی مدلهای تجاری با سطح بالا مانند GPT-4o از OpenAI ارائه داده است.
مدل استدلالی R1 که در دیماه رونمایی شد نیز یکی دیگر از محصولات بارز دیپسیک است. این مدل، با قابلیت تحلیل و ارزیابی پاسخهای خود، در حل مسائل پیچیده در زمینههایی نظیر فیزیک، علوم و ریاضیات دقت بیشتری دارد، هرچند فرآیند پردازش آن قدری زمانبرتر از مدلهای معمولی است.
لکن، یکی از چالشهای قابل توجه در مورد مدلهای دیپسیک، فیلترینگهای اعمال شده توسط نهادهای ناظر بر اینترنت در چین است. برای مثال، مدل R1 در اپلیکیشن چتبات دیپسیک از پاسخدهی به سؤالاتی در مورد میدان تیانآنمن یا استقلال تایوان خودداری میکند.
رشد کاربران و واکنشها
در اسفند ماه، تعداد بازدیدهای دیپسیک از مرز ۱۶.۵ میلیون عبور کرد. دیوید کار، سردبیر Similarweb، گزارش داد که با وجود کاهش ۲۵ درصدی ترافیک نسبت به بهمن، دیپسیک از لحاظ بازدیدهای روزانه در مقام دوم قرار دارد، هرچند این رقم در مقایسه با ChatGPT که در همان ماه از ۵۰۰ میلیون کاربر فعال هفتگی فراتر رفت، رقم نسبتا کمی به شمار میآید.
در اردیبهشت ماه، نسخه بهروزشده مدل استدلالی R1 بر روی پلتفرم Hugging Face عرضه شد.
مدل کسبوکار غیرمتعارف
دیپسیک علیرغم تقاضای بالای سرمایهگذاران خطرپذیر، تاکنون موفق به جذب سرمایه از آنها نشده و محصولات خود را با قیمتی کمتر از نرخ بازار یا حتی به صورت رایگان ارائه میدهد. به ادعای این شرکت، پیشرفتهای فناورانه در کارایی به آن کمک کرده است تا بتواند با هزینه پایین، به رقابت باقی بماند. با این وجود، برخی کارشناسان نسبت به صحت این ادعاها تردید دارند.
اگر چه مدلهای دیپسیک به طور کامل متنباز نیستند، اما تحت مجوزهای خاصی عرضه میشوند که امکان استفاده تجاری از آنها را فراهم میآورد. مدیرعامل پلتفرم Hugging Face اعلام کرده که تا به حال بیش از ۵۰۰ مدل مشتقشده از R1 ایجاد شده است که در مجموع ۲.۵ میلیون بار دانلود شدهاند.
واکنش جهانی و چالشهای سیاسی
موفقیت دیپسیک که برخی تحلیلگران آن را «تحولی در هوش مصنوعی» و برخی دیگر «اغراقآمیز» مینامند، تأثیر قابل توجهی بر بازار داشته است. به عنوان نمونه میتوان به کاهش ۱۸ درصدی ارزش سهام شرکت Nvidia در دیماه اشاره کرد که به واکنش سم آلتمن، مدیرعامل OpenAI نیز منجر شد.
در اسفند ماه، وزارت بازرگانی ایالات متحده استفاده از دیپسیک در دستگاههای دولتی را ممنوع اعلام کرد. به علاوه، شرکت مایکروسافت گزارش داد که مدلهای دیپسیک در پلتفرم Azure AI Foundry در دسترس قرار گرفتهاند. با این حال، برد اسمیت، نایبرئیس مایکروسافت، به طور صریح در جلسهای در سنای آمریکا تأکید کرد که کارکنان این شرکت به دلایل امنیتی و تبلیغاتی تحت هیچ شرایطی اجازه استفاده از دیپسیک را ندارند.
مدیرعامل شرکت انویدیا نیز در جریان ارائه گزارش مالی، بر «نوآوری تحسینبرانگیز» دیپسیک تأکید کرد و افزود که مدلهای استدلالی همانند R1 به دلیل نیاز به پردازش بالاتر، برای کسبوکار این شرکت سودمند هستند.
در عین حال، برخی کشورها و نهادهای دولتی از جمله کره جنوبی و ایالت نیویورک، استفاده از دیپسیک را ممنوع کردهاند.
آیندهای نامشخص
آینده دیپسیک پر از ابهامات است. هر چند توسعه مدلهای پیشرفتهتر به نظر حتمی میرسد، نگرانیهای سیاسی و امنیتی، به ویژه از جانب ایالات متحده، ممکن است بر سرنوشت این شرکت تأثیر گذاری کند. بر اساس گزارشی از والاستریت ژورنال در اسفند ماه، دولت ایالات متحده در حال ارزیابی ممنوعیت کامل استفاده از دیپسیک در دستگاههای دولتی میباشد.