DeepSeek چه هست؟ نگاهی به چت‌باتی که غول‌های فناوری را به امتحان گذاشت

22 ساعت پیش

زمان تقریبی مطالعه 4 دقیقه

DeepSeek چیست؟ نگاهی به چت‌باتی که غول‌های فناوری را به چالش کشید

آزمایشگاه هوش مصنوعی چینی «دیپ‌سیک» (DeepSeek) اخیراً با قرار گرفتن اپلیکیشن چت‌بات این شرکت در صدر جدول اپ‌استور اپل و گوگل‌پلی، دنیای فناوری را به حیرت واداشته است.

به نقل از ایتنا و بر اساس گزارشی از تک‌کرانچ، موفقیت این مدل‌ها که به واسطه روش‌های محاسباتی نوین به بار نشسته‌اند، بررسی‌گران وال‌استریت و فعالان بخش فناوری را به تأمل واداشته است که آیا ایالات متحده قادر به حفظ برتری تاریخی خود در عرصه هوش مصنوعی خواهد بود و آیا تقاضا برای تراشه‌های مرتبط با این فناوری می‌تواند ادامه یابد یا خیر.

اما دیپ‌سیک چگونه شکل گرفت و توانسته است در زمان نسبتاً کوتاهی به چنین شهرتی برسد؟

پایه‌گذاری دیپ‌سیک در دنیای معاملات

دیپ‌سیک تحت حمایت شرکت مدیریت سرمایه High-Flyer، که یکی از صندوق‌های پوشش ریسک کمی در چین می‌باشد و از هوش مصنوعی برای تصمیم‌گیری‌های تجاری خود بهره می‌برد، فعالیت می‌کند.

«لیانگ ونفنگ»، بنیان‌گذار این شرکت، با علاقه به حوزه هوش مصنوعی، High-Flyer را در سال ۲۰۱۵ تأسیس نمود. او از دوران دانشجویی خود در دانشگاه ژجیانگ به فعالیت در زمینه معاملات پرداخت و در سال ۲۰۱۹، مدیریت High-Flyer Capital Management را با رویکردی متمرکز بر توسعه الگوریتم‌های هوش مصنوعی آغاز کرد.

در سال ۲۰۲۳، شرکت High-Flyer اقدام به تأسیس آزمایشگاه دیپ‌سیک کرد؛ نهادی مستقل برای تحقیق و توسعه ابزارهای هوش مصنوعی که به فعالیت‌های مالی این شرکت وابسته نبود. با حمایت مالی High-Flyer، دیپ‌سیک به شرکتی مستقل در عرصه فناوری بدل شد.

این نهاد از همان آغاز به ایجاد زیرساخت‌های مخصوص به خود جهت آموزش مدل‌های هوش مصنوعی پرداخت. البته، مشابه دیگر شرکت‌های فعال در این حوزه در چین، دیپ‌سیک نیز از محدودیت‌های صادراتی ایالات متحده در زمینه سخت‌افزار آسیب دید و برای آموزش مدل‌های جدید ناچار به استفاده از تراشه‌های ضعیف‌تر Nvidia H800 (نسخه‌ای محدودتر از H100 که در اختیار شرکت‌های آمریکایی است) شد.

گزارش‌ها حاکی از آن است که تیم فنی دیپ‌سیک عمدتاً شامل افرادی جوان است و این شرکت به طرز ویژه‌ای بر جذب پژوهشگران دکتری از دانشگاه‌های معتبر چین تمرکز دارد. بر اساس گزارشی از نیویورک‌تایمز، دیپ‌سیک حتی افرادی را با سوابق غیررایانه جذب می‌کند تا تنوع موضوعی و رویکردی چندرشته‌ای را در توسعه فناوری خود افزایش دهد.

مدل‌های پیشرفته DeepSeek

دیپ‌سیک اولین مجموعه مدل‌های خود شامل DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را در آبان ماه ۱۴۰۲ (نوامبر ۲۰۲۳) رونمایی کرد. اما جلب توجه گسترده صنعت هوش مصنوعی زمانی به وقوع پیوست که این شرکت در بهار گذشته نسل دوم مدل‌های خود تحت عنوان DeepSeek-V2 را معرفی نمود.

مدل DeepSeek-V2 با قابلیت تحلیل توأم متن و تصویر، در آزمون‌های متعدد عملکرد باورنکردنی از خود ارائه داد. هزینه کم راه‌اندازی آن نسبت به مدل‌های مشابه، موجب شد رقبا از جمله ByteDance و Alibaba قیمت برخی از مدل‌های خود را کاهش دهند و حتی مدل‌هایی را به صورت رایگان عرضه کنند.

مدل DeepSeek-V3 که در آذرماه ۱۴۰۳ معرفی شد، در ارتقاء شهرت این شرکت نیز تأثیر بسزایی داشت. ارزیابی‌های داخلی نشان می‌دهد که این مدل عملکرد بهتری نسبت به مدل‌های متن‌باز مانند Llama از Meta و حتی مدل‌های تجاری با سطح بالا مانند GPT-4o از OpenAI ارائه داده است.

مدل استدلالی R1 که در دی‌ماه رونمایی شد نیز یکی دیگر از محصولات بارز دیپ‌سیک است. این مدل، با قابلیت تحلیل و ارزیابی پاسخ‌های خود، در حل مسائل پیچیده در زمینه‌هایی نظیر فیزیک، علوم و ریاضیات دقت بیشتری دارد، هرچند فرآیند پردازش آن قدری زمان‌برتر از مدل‌های معمولی است.

لکن، یکی از چالش‌های قابل توجه در مورد مدل‌های دیپ‌سیک، فیلترینگ‌های اعمال شده توسط نهادهای ناظر بر اینترنت در چین است. برای مثال، مدل R1 در اپلیکیشن چت‌بات دیپ‌سیک از پاسخ‌دهی به سؤالاتی در مورد میدان تیان‌آن‌من یا استقلال تایوان خودداری می‌کند.

رشد کاربران و واکنش‌ها

در اسفند ماه، تعداد بازدیدهای دیپ‌سیک از مرز ۱۶.۵ میلیون عبور کرد. دیوید کار، سردبیر Similarweb، گزارش داد که با وجود کاهش ۲۵ درصدی ترافیک نسبت به بهمن، دیپ‌سیک از لحاظ بازدیدهای روزانه در مقام دوم قرار دارد، هرچند این رقم در مقایسه با ChatGPT که در همان ماه از ۵۰۰ میلیون کاربر فعال هفتگی فراتر رفت، رقم نسبتا کمی به شمار می‌آید.

در اردیبهشت ماه، نسخه به‌روزشده مدل استدلالی R1 بر روی پلتفرم Hugging Face عرضه شد.

مدل کسب‌وکار غیرمتعارف

دیپ‌سیک علی‌رغم تقاضای بالای سرمایه‌گذاران خطرپذیر، تاکنون موفق به جذب سرمایه از آن‌ها نشده و محصولات خود را با قیمتی کمتر از نرخ بازار یا حتی به صورت رایگان ارائه می‌دهد. به ادعای این شرکت، پیشرفت‌های فناورانه در کارایی به آن کمک کرده است تا بتواند با هزینه پایین، به رقابت باقی بماند. با این وجود، برخی کارشناسان نسبت به صحت این ادعاها تردید دارند.

اگر چه مدل‌های دیپ‌سیک به طور کامل متن‌باز نیستند، اما تحت مجوزهای خاصی عرضه می‌شوند که امکان استفاده تجاری از آن‌ها را فراهم می‌آورد. مدیرعامل پلتفرم Hugging Face اعلام کرده که تا به حال بیش از ۵۰۰ مدل مشتق‌شده از R1 ایجاد شده است که در مجموع ۲.۵ میلیون بار دانلود شده‌اند.

واکنش جهانی و چالش‌های سیاسی

موفقیت دیپ‌سیک که برخی تحلیلگران آن را «تحولی در هوش مصنوعی» و برخی دیگر «اغراق‌آمیز» می‌نامند، تأثیر قابل توجهی بر بازار داشته است. به عنوان نمونه می‌توان به کاهش ۱۸ درصدی ارزش سهام شرکت Nvidia در دی‌ماه اشاره کرد که به واکنش سم آلتمن، مدیرعامل OpenAI نیز منجر شد.

در اسفند ماه، وزارت بازرگانی ایالات متحده استفاده از دیپ‌سیک در دستگاه‌های دولتی را ممنوع اعلام کرد. به علاوه، شرکت مایکروسافت گزارش داد که مدل‌های دیپ‌سیک در پلتفرم Azure AI Foundry در دسترس قرار گرفته‌اند. با این حال، برد اسمیت، نایب‌رئیس مایکروسافت، به طور صریح در جلسه‌ای در سنای آمریکا تأکید کرد که کارکنان این شرکت به دلایل امنیتی و تبلیغاتی تحت هیچ شرایطی اجازه استفاده از دیپ‌سیک را ندارند.

مدیرعامل شرکت انویدیا نیز در جریان ارائه گزارش مالی، بر «نوآوری تحسین‌برانگیز» دیپ‌سیک تأکید کرد و افزود که مدل‌های استدلالی همانند R1 به دلیل نیاز به پردازش بالاتر، برای کسب‌وکار این شرکت سودمند هستند.

در عین حال، برخی کشورها و نهادهای دولتی از جمله کره جنوبی و ایالت نیویورک، استفاده از دیپ‌سیک را ممنوع کرده‌اند.

آینده‌ای نامشخص

آینده دیپ‌سیک پر از ابهامات است. هر چند توسعه مدل‌های پیشرفته‌تر به نظر حتمی می‌رسد، نگرانی‌های سیاسی و امنیتی، به ویژه از جانب ایالات متحده، ممکن است بر سرنوشت این شرکت تأثیر گذاری کند. بر اساس گزارشی از وال‌استریت ژورنال در اسفند ماه، دولت ایالات متحده در حال ارزیابی ممنوعیت کامل استفاده از دیپ‌سیک در دستگاه‌های دولتی می‌باشد.

22 ساعت پیش

زمان تقریبی مطالعه 4 دقیقه

مشاهده بیشتر