BMS, BUS, தொழில்துறை, இன்ஸ்ட்ருமென்டேஷன் கேபிளுக்கு.

வசந்த விழா நிறைவடையும் வேளையில், DeepSeek-ஐச் சுற்றியுள்ள உற்சாகம் வலுவாக உள்ளது. சமீபத்திய விடுமுறை தொழில்நுட்பத் துறைக்குள் ஒரு குறிப்பிடத்தக்க போட்டி உணர்வை எடுத்துக்காட்டுகிறது, பலர் இந்த "கேட்ஃபிஷ்" பற்றி விவாதித்து பகுப்பாய்வு செய்கிறார்கள். சிலிக்கான் வேலி முன்னோடியில்லாத நெருக்கடி உணர்வை அனுபவித்து வருகிறது: திறந்த மூலத்தை ஆதரிப்பவர்கள் மீண்டும் தங்கள் கருத்துக்களை வெளிப்படுத்துகிறார்கள், மேலும் OpenAI கூட அதன் மூடிய மூல உத்தி சிறந்த தேர்வாக இருந்ததா என்பதை மறு மதிப்பீடு செய்து வருகிறது. குறைந்த கணக்கீட்டு செலவுகளின் புதிய முன்னுதாரணமானது Nvidia போன்ற சிப் ஜாம்பவான்களிடையே ஒரு சங்கிலி எதிர்வினையைத் தூண்டியுள்ளது, இது அமெரிக்க பங்குச் சந்தை வரலாற்றில் ஒரு நாள் சந்தை மதிப்பு இழப்புகளை பதிவு செய்ய வழிவகுத்தது, அதே நேரத்தில் DeepSeek பயன்படுத்தும் சில்லுகளின் இணக்கத்தை அரசு நிறுவனங்கள் ஆராய்ந்து வருகின்றன. DeepSeek வெளிநாடுகளில் கலவையான விமர்சனங்களுக்கு மத்தியில், உள்நாட்டில், அது அசாதாரண வளர்ச்சியை அனுபவித்து வருகிறது. R1 மாதிரியை அறிமுகப்படுத்திய பிறகு, தொடர்புடைய செயலி போக்குவரத்தில் ஒரு எழுச்சியைக் கண்டுள்ளது, இது பயன்பாட்டுத் துறைகளில் வளர்ச்சி ஒட்டுமொத்த AI சுற்றுச்சூழல் அமைப்பை முன்னோக்கி நகர்த்தும் என்பதைக் குறிக்கிறது. நேர்மறையான அம்சம் என்னவென்றால், DeepSeek பயன்பாட்டு சாத்தியங்களை விரிவுபடுத்தும், இது எதிர்காலத்தில் ChatGPT-ஐ நம்பியிருப்பது அவ்வளவு விலை உயர்ந்ததாக இருக்காது என்பதைக் குறிக்கிறது. இந்த மாற்றம் OpenAI இன் சமீபத்திய செயல்பாடுகளில் பிரதிபலித்தது, இதில் DeepSeek R1 க்கு பதிலளிக்கும் விதமாக இலவச பயனர்களுக்கு o3-mini எனப்படும் பகுத்தறிவு மாதிரியை வழங்குவதும், o3-mini இன் சிந்தனைச் சங்கிலியைப் பொதுமக்களுக்குக் கொண்டு வந்த அடுத்தடுத்த மேம்படுத்தல்களும் அடங்கும். பல வெளிநாட்டு பயனர்கள் இந்த மேம்பாடுகளுக்கு DeepSeek க்கு நன்றி தெரிவித்தனர், இருப்பினும் இந்த சிந்தனைச் சங்கிலி ஒரு சுருக்கமாக செயல்படுகிறது.
நம்பிக்கையுடன், DeepSeek உள்நாட்டு நிறுவனங்களை ஒன்றிணைத்து வருகிறது என்பது தெளிவாகிறது. பயிற்சி செலவுகளைக் குறைப்பதில் கவனம் செலுத்துவதன் மூலம், பல்வேறு அப்ஸ்ட்ரீம் சிப் உற்பத்தியாளர்கள், இடைநிலை கிளவுட் வழங்குநர்கள் மற்றும் ஏராளமான தொடக்க நிறுவனங்கள் சுற்றுச்சூழல் அமைப்பில் தீவிரமாக இணைகின்றன, DeepSeek மாதிரியைப் பயன்படுத்துவதற்கான செலவுத் திறனை மேம்படுத்துகின்றன. DeepSeek இன் ஆவணங்களின்படி, V3 மாதிரியின் முழுமையான பயிற்சிக்கு 2.788 மில்லியன் H800 GPU மணிநேரங்கள் மட்டுமே தேவைப்படுகின்றன, மேலும் பயிற்சி செயல்முறை மிகவும் நிலையானது. 405 பில்லியன் அளவுருக்கள் கொண்ட Llama 3 உடன் ஒப்பிடும்போது பயிற்சிக்கு முந்தைய செலவுகளை பத்து மடங்கு குறைப்பதற்கு MoE (நிபுணர்களின் கலவை) கட்டமைப்பு மிக முக்கியமானது. தற்போது, MoE இல் இவ்வளவு அதிக இடைவெளியைக் காட்டும் முதல் பொதுவில் அங்கீகரிக்கப்பட்ட மாதிரி V3 ஆகும். கூடுதலாக, MLA (மல்டி லேயர் அட்டென்ஷன்) ஒருங்கிணைந்த முறையில் செயல்படுகிறது, குறிப்பாக பகுத்தறிவு அம்சங்களில். "MoE எவ்வளவு குறைவாக இருக்கிறதோ, அவ்வளவு பெரிய அளவு கணக்கீட்டு சக்தியை முழுமையாகப் பயன்படுத்த பகுத்தறிவின் போது தேவைப்படுகிறது, KVCache இன் அளவு முக்கிய கட்டுப்படுத்தும் காரணியாகும்; MLA KVCache அளவைக் கணிசமாகக் குறைக்கிறது," என்று AI தொழில்நுட்ப மதிப்பாய்விற்கான பகுப்பாய்வில் சுவான்ஜிங் தொழில்நுட்பத்தைச் சேர்ந்த ஒரு ஆராய்ச்சியாளர் குறிப்பிட்டார். ஒட்டுமொத்தமாக, டீப்சீக்கின் வெற்றி என்பது ஒற்றை தொழில்நுட்பத்தின் கலவையில் அல்ல, பல்வேறு தொழில்நுட்பங்களின் கலவையில் உள்ளது. தொழில்துறையினர் டீப்சீக் குழுவின் பொறியியல் திறன்களைப் பாராட்டுகிறார்கள், இணையான பயிற்சி மற்றும் ஆபரேட்டர் உகப்பாக்கத்தில் அவர்களின் சிறந்து விளங்குவதையும், ஒவ்வொரு விவரத்தையும் செம்மைப்படுத்துவதன் மூலம் புதிய முடிவுகளை அடைவதையும் குறிப்பிடுகிறார்கள். டீப்சீக்கின் திறந்த மூல அணுகுமுறை பெரிய மாடல்களின் ஒட்டுமொத்த வளர்ச்சியை மேலும் தூண்டுகிறது, மேலும் இதே போன்ற மாதிரிகள் படங்கள், வீடியோக்கள் மற்றும் பலவற்றில் விரிவடைந்தால், இது தொழில்துறை முழுவதும் தேவையை கணிசமாகத் தூண்டும் என்று எதிர்பார்க்கப்படுகிறது.
மூன்றாம் தரப்பு பகுத்தறிவு சேவைகளுக்கான வாய்ப்புகள்
வெளியானதிலிருந்து, DeepSeek வெறும் 21 நாட்களுக்குள் 22.15 மில்லியன் தினசரி செயலில் உள்ள பயனர்களை (DAU) ஈர்த்துள்ளது, ChatGPT இன் பயனர் தளத்தில் 41.6% ஐ எட்டியுள்ளது மற்றும் Doubao இன் தினசரி செயலில் உள்ள பயனர்களின் எண்ணிக்கையை 16.95 மில்லியனைத் தாண்டியுள்ளது, இதனால் உலகளவில் வேகமாக வளர்ந்து வரும் பயன்பாடாக மாறியுள்ளது, 157 நாடுகள்/பிராந்தியங்களில் Apple App Store இல் முதலிடத்தில் உள்ளது. இருப்பினும், பயனர்கள் கூட்டம் கூட்டமாக வந்தாலும், சைபர் ஹேக்கர்கள் DeepSeek பயன்பாட்டை இடைவிடாமல் தாக்கி வருகின்றனர், இதனால் அதன் சேவையகங்களில் குறிப்பிடத்தக்க அழுத்தம் ஏற்படுகிறது. பகுத்தறிவுக்கு போதுமான கணக்கீட்டு சக்தி இல்லாத நிலையில், DeepSeek பயிற்சிக்காக அட்டைகளைப் பயன்படுத்துவதே இதற்குக் காரணம் என்று தொழில்துறை ஆய்வாளர்கள் நம்புகின்றனர். "அடிக்கடி ஏற்படும் சர்வர் சிக்கல்களை கட்டணம் வசூலிப்பதன் மூலமோ அல்லது அதிக இயந்திரங்களை வாங்க நிதியளிப்பதன் மூலமோ எளிதாக தீர்க்க முடியும்; இறுதியில், இது DeepSeek இன் முடிவுகளைப் பொறுத்தது" என்று தொழில்துறையின் உள் நபர் AI தொழில்நுட்ப மதிப்பாய்விற்கு தெரிவித்தார். இது தொழில்நுட்பம் மற்றும் உற்பத்தியில் கவனம் செலுத்துவதில் ஒரு சமரசத்தை முன்வைக்கிறது. DeepSeek சுய-வாழ்வாதாரத்திற்காக பெரும்பாலும் குவாண்டம் அளவீட்டை நம்பியுள்ளது, சிறிய வெளிப்புற நிதியைப் பெற்றதால், ஒப்பீட்டளவில் குறைந்த பணப்புழக்க அழுத்தம் மற்றும் தூய்மையான தொழில்நுட்ப சூழல் ஏற்பட்டுள்ளது. தற்போது, மேற்கூறிய சிக்கல்களின் வெளிச்சத்தில், சில பயனர்கள் சமூக ஊடகங்களில் DeepSeek-ஐ பயன்பாட்டு வரம்புகளை உயர்த்த அல்லது பயனர் வசதியை மேம்படுத்த கட்டண அம்சங்களை அறிமுகப்படுத்த வலியுறுத்துகின்றனர். கூடுதலாக, டெவலப்பர்கள் அதிகாரப்பூர்வ API அல்லது மூன்றாம் தரப்பு API-களை உகப்பாக்கத்திற்காகப் பயன்படுத்தத் தொடங்கியுள்ளனர். இருப்பினும், DeepSeek-இன் திறந்த தளம் சமீபத்தில் அறிவித்தது, "தற்போதைய சேவையக வளங்கள் பற்றாக்குறையாக உள்ளன, மேலும் API சேவை ரீசார்ஜ்கள் இடைநிறுத்தப்பட்டுள்ளன."
இது சந்தேகத்திற்கு இடமின்றி AI உள்கட்டமைப்புத் துறையில் மூன்றாம் தரப்பு விற்பனையாளர்களுக்கு அதிக வாய்ப்புகளைத் திறக்கிறது. சமீபத்தில், ஏராளமான உள்நாட்டு மற்றும் சர்வதேச கிளவுட் ஜாம்பவான்கள் DeepSeek இன் மாதிரி APIகளை அறிமுகப்படுத்தியுள்ளன - வெளிநாட்டு ஜாம்பவான்களான Microsoft மற்றும் Amazon ஆகியவை ஜனவரி மாத இறுதியில் இணைந்த முதல் நிறுவனங்களில் அடங்கும். உள்நாட்டுத் தலைவரான Huawei Cloud, முதல் நகர்வை மேற்கொண்டது, பிப்ரவரி 1 அன்று சிலிக்கான் அடிப்படையிலான Flow உடன் இணைந்து DeepSeek R1 மற்றும் V3 பகுத்தறிவு சேவைகளை வெளியிட்டது. AI Technology Review இன் அறிக்கைகள், சிலிக்கான் அடிப்படையிலான Flow இன் சேவைகள் பயனர்களின் வருகையைக் கண்டுள்ளன, இது தளத்தை திறம்பட "செயலிழக்கச்" செய்துள்ளது என்பதைக் குறிக்கிறது. BAT (Baidu, Alibaba, Tencent) மற்றும் ByteDance ஆகிய மூன்று பெரிய தொழில்நுட்ப நிறுவனங்களும் பிப்ரவரி 3 முதல் குறைந்த விலை, வரையறுக்கப்பட்ட நேர சலுகைகளை வெளியிட்டன, இது கடந்த ஆண்டு DeepSeek இன் V2 மாதிரி வெளியீட்டால் தூண்டப்பட்ட கிளவுட் விற்பனையாளர் விலைப் போர்களை நினைவூட்டுகிறது, அங்கு DeepSeek "விலை கசாப்புக்காரன்" என்று அழைக்கப்பட்டது. கிளவுட் விற்பனையாளர்களின் வெறித்தனமான நடவடிக்கைகள், மைக்ரோசாஃப்ட் அஸூர் மற்றும் ஓபன்ஏஐ இடையேயான முந்தைய வலுவான உறவுகளை எதிரொலிக்கின்றன, அங்கு 2019 ஆம் ஆண்டில், மைக்ரோசாப்ட் ஓபன்ஏஐயில் கணிசமான $1 பில்லியன் முதலீட்டைச் செய்து 2023 இல் ChatGPT அறிமுகப்படுத்தப்பட்ட பிறகு பலன்களைப் பெற்றது. இருப்பினும், மெட்டா ஓப்பன்-சோர்ஸ் ல்லாமாவை உருவாக்கிய பிறகு இந்த நெருங்கிய உறவு மோசமடையத் தொடங்கியது, இது மைக்ரோசாஃப்ட் அஸூர் சுற்றுச்சூழல் அமைப்புக்கு வெளியே உள்ள மற்ற விற்பனையாளர்கள் தங்கள் பெரிய மாடல்களுடன் போட்டியிட அனுமதித்தது. இந்த நிகழ்வில், டீப்சீக் தயாரிப்பு வெப்பத்தின் அடிப்படையில் ChatGPT ஐ விஞ்சியது மட்டுமல்லாமல், o1 வெளியீட்டைத் தொடர்ந்து திறந்த மூல மாதிரிகளையும் அறிமுகப்படுத்தியுள்ளது, இது லாமாவின் GPT-3 இன் மறுமலர்ச்சியைச் சுற்றியுள்ள உற்சாகத்தைப் போன்றது.
உண்மையில், கிளவுட் வழங்குநர்கள் AI பயன்பாடுகளுக்கான போக்குவரத்து நுழைவாயில்களாக தங்களை நிலைநிறுத்திக் கொள்கிறார்கள், அதாவது டெவலப்பர்களுடனான உறவுகளை ஆழப்படுத்துவது முன்கூட்டியே நன்மைகளுக்கு வழிவகுக்கிறது. மாதிரியின் வெளியீட்டு நாளில் கியான்ஃபான் தளம் வழியாக டீப்சீக் மாதிரியைப் பயன்படுத்திய 15,000 க்கும் மேற்பட்ட வாடிக்கையாளர்களை பைடு ஸ்மார்ட் கிளவுட் கொண்டிருந்ததாக அறிக்கைகள் குறிப்பிடுகின்றன. கூடுதலாக, சிலிக்கான் அடிப்படையிலான ஃப்ளோ, லுச்சென் டெக்னாலஜி, சுவான்ஜிங் டெக்னாலஜி மற்றும் டீப்சீக் மாடல்களுக்கான ஆதரவைத் தொடங்கிய பல்வேறு AI இன்ஃப்ரா வழங்குநர்கள் உள்ளிட்ட பல சிறிய நிறுவனங்கள் தீர்வுகளை வழங்குகின்றன. டீப்சீக்கின் உள்ளூர்மயமாக்கப்பட்ட பயன்பாடுகளுக்கான தற்போதைய உகப்பாக்க வாய்ப்புகள் முதன்மையாக இரண்டு பகுதிகளில் உள்ளன என்பதை AI தொழில்நுட்ப மதிப்பாய்வு அறிந்துகொண்டது: ஒன்று கலப்பின GPU/CPU அனுமானத்தைப் பயன்படுத்தி 671 பில்லியன் அளவுரு MoE மாதிரியை உள்நாட்டில் பயன்படுத்த கலப்பு பகுத்தறிவு அணுகுமுறையைப் பயன்படுத்தி MoE மாதிரியின் ஸ்பார்சிட்டி பண்புகளை மேம்படுத்துவதாகும். கூடுதலாக, MLA இன் உகப்பாக்கம் மிக முக்கியமானது. இருப்பினும், டீப்சீக்கின் இரண்டு மாதிரிகள் இன்னும் வரிசைப்படுத்தல் உகப்பாக்கத்தில் சில சவால்களை எதிர்கொள்கின்றன. "மாதிரியின் அளவு மற்றும் ஏராளமான அளவுருக்கள் காரணமாக, உகப்பாக்கம் உண்மையில் சிக்கலானது, குறிப்பாக உள்ளூர் பயன்பாடுகளுக்கு, செயல்திறன் மற்றும் செலவுக்கு இடையில் உகந்த சமநிலையை அடைவது சவாலானதாக இருக்கும்," என்று சுவான்ஜிங் டெக்னாலஜியைச் சேர்ந்த ஒரு ஆராய்ச்சியாளர் கூறினார். நினைவக திறன் வரம்புகளை முழுமையாகப் பயன்படுத்துவதற்கு நாங்கள் ஒரு பன்முக ஒத்துழைப்பு அணுகுமுறையை ஏற்றுக்கொள்கிறோம். "CPUகள் மற்றும் பிற கணக்கீட்டு வளங்களை முழுமையாகப் பயன்படுத்த, அதிக செயல்திறன் கொண்ட CPU ஆபரேட்டர்களைப் பயன்படுத்தி செயலாக்கத்திற்காக CPU/DRAM இல் சிதறிய MoE மேட்ரிக்ஸின் பகிரப்படாத பகுதிகளை மட்டுமே வைக்கிறோம், அதே நேரத்தில் அடர்த்தியான பகுதிகள் GPU இல் இருக்கும்," என்று அவர் மேலும் விளக்கினார். சுவான்ஜிங்கின் திறந்த மூல கட்டமைப்பான KTransformers முதன்மையாக பல்வேறு உத்திகள் மற்றும் ஆபரேட்டர்களை அசல் டிரான்ஸ்ஃபார்மர்கள் செயல்படுத்தலில் ஒரு டெம்ப்ளேட் மூலம் செலுத்துகிறது, CUDAGraph போன்ற முறைகளைப் பயன்படுத்தி அனுமான வேகத்தை கணிசமாக அதிகரிக்கிறது என்று அறிக்கைகள் குறிப்பிடுகின்றன. வளர்ச்சி நன்மைகள் வெளிப்படையாகி வருவதால், டீப்சீக் இந்த தொடக்கங்களுக்கான வாய்ப்புகளை உருவாக்கியுள்ளது; பல நிறுவனங்கள் டீப்சீக் API ஐ அறிமுகப்படுத்திய பிறகு குறிப்பிடத்தக்க வாடிக்கையாளர் வளர்ச்சியைப் புகாரளித்துள்ளன, மேம்படுத்தல்களைத் தேடும் முந்தைய வாடிக்கையாளர்களிடமிருந்து விசாரணைகளைப் பெற்றுள்ளன. "கடந்த காலத்தில், ஓரளவு நிறுவப்பட்ட வாடிக்கையாளர் குழுக்கள் பெரும்பாலும் பெரிய நிறுவனங்களின் தரப்படுத்தப்பட்ட சேவைகளில் சிக்கிக் கொண்டன, ஏனெனில் அவை அளவு காரணமாக அவற்றின் செலவு நன்மைகளால் இறுக்கமாக பிணைக்கப்பட்டன. இருப்பினும், வசந்த விழாவிற்கு முன்பு DeepSeek-R1/V3 இன் பயன்பாட்டை முடித்த பிறகு, திடீரென்று பல நன்கு அறியப்பட்ட வாடிக்கையாளர்களிடமிருந்து ஒத்துழைப்பு கோரிக்கைகளைப் பெற்றோம், மேலும் முன்னர் செயலற்ற வாடிக்கையாளர்களும் கூட எங்கள் DeepSeek சேவைகளை அறிமுகப்படுத்தத் தொடங்கினர்." தற்போது, DeepSeek மாதிரி அனுமான செயல்திறனை மேலும் மேலும் முக்கியமானதாக ஆக்குகிறது, மேலும் பெரிய மாதிரிகளை பரவலாக ஏற்றுக்கொள்வதன் மூலம், இது AI இன்ஃப்ரா துறையில் வளர்ச்சியை கணிசமாக பாதிக்கும். DeepSeek-நிலை மாதிரியை குறைந்த செலவில் உள்ளூரில் பயன்படுத்த முடிந்தால், அது அரசு மற்றும் நிறுவன டிஜிட்டல் உருமாற்ற முயற்சிகளுக்கு பெரிதும் உதவும். இருப்பினும், சவால்கள் தொடர்கின்றன, ஏனெனில் சில வாடிக்கையாளர்கள் பெரிய மாதிரி திறன்கள் குறித்து அதிக எதிர்பார்ப்புகளை வைத்திருக்கலாம், இது நடைமுறை பயன்பாட்டில் செயல்திறன் மற்றும் செலவை சமநிலைப்படுத்துவது மிக முக்கியமானது என்பதை மேலும் தெளிவுபடுத்துகிறது.
ChatGPT-ஐ விட DeepSeek சிறந்ததா என்பதை மதிப்பிடுவதற்கு, அவற்றின் முக்கிய வேறுபாடுகள், பலங்கள் மற்றும் பயன்பாட்டு நிகழ்வுகளைப் புரிந்துகொள்வது அவசியம். இங்கே ஒரு விரிவான ஒப்பீடு உள்ளது:
அம்சம்/அம்சம் | டீப்சீக் | அரட்டைஜிபிடி |
---|---|---|
உரிமை | ஒரு சீன நிறுவனத்தால் உருவாக்கப்பட்டது | OpenAI ஆல் உருவாக்கப்பட்டது |
மூல மாதிரி | திறந்த மூல | தனியுரிமை |
செலவு | பயன்படுத்த இலவசம்; மலிவான API அணுகல் விருப்பங்கள் | சந்தா அல்லது பயன்பாட்டிற்கு பணம் செலுத்தும் விலை நிர்ணயம் |
தனிப்பயனாக்கம் | மிகவும் தனிப்பயனாக்கக்கூடியது, பயனர்கள் அதை மாற்றியமைத்து உருவாக்க அனுமதிக்கிறது. | வரையறுக்கப்பட்ட தனிப்பயனாக்கம் கிடைக்கிறது |
குறிப்பிட்ட பணிகளில் செயல்திறன் | தரவு பகுப்பாய்வு மற்றும் தகவல் மீட்டெடுப்பு போன்ற சில பகுதிகளில் சிறந்து விளங்குகிறது. | படைப்பு எழுத்து மற்றும் உரையாடல் பணிகளில் வலுவான செயல்திறனுடன் பல்துறை திறன். |
மொழி ஆதரவு | சீன மொழி மற்றும் கலாச்சாரத்தில் வலுவான கவனம். | பரந்த மொழி ஆதரவு ஆனால் அமெரிக்காவை மையமாகக் கொண்டது |
பயிற்சி செலவு | குறைந்த பயிற்சி செலவுகள், செயல்திறனுக்காக உகந்ததாக்கப்பட்டது | அதிக பயிற்சி செலவுகள், கணிசமான கணக்கீட்டு வளங்கள் தேவை. |
மறுமொழி மாறுபாடு | புவிசார் அரசியல் சூழலால் பாதிக்கப்படக்கூடிய, வெவ்வேறு பதில்களை வழங்கக்கூடும். | பயிற்சித் தரவின் அடிப்படையில் நிலையான பதில்கள் |
இலக்கு பார்வையாளர்கள் | நெகிழ்வுத்தன்மையை விரும்பும் டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்களை இலக்காகக் கொண்டது. | உரையாடல் திறன்களைத் தேடும் பொது பயனர்களை இலக்காகக் கொண்டது. |
பயன்பாட்டு வழக்குகள் | குறியீடு உருவாக்கம் மற்றும் விரைவான பணிகளுக்கு மிகவும் திறமையானது. | உரையை உருவாக்குவதற்கும், கேள்விகளுக்கு பதிலளிப்பதற்கும், உரையாடலில் ஈடுபடுவதற்கும் ஏற்றது. |
"என்விடியாவை சீர்குலைத்தல்" பற்றிய ஒரு விமர்சனக் கண்ணோட்டம்
தற்போது, Huawei தவிர, Moore Threads, Muxi, Biran Technology மற்றும் Tianxu Zhixin போன்ற பல உள்நாட்டு சிப் உற்பத்தியாளர்களும் DeepSeek இன் இரண்டு மாடல்களுக்கு ஏற்றவாறு மாறி வருகின்றனர். ஒரு சிப் உற்பத்தியாளர் AI Technology Review இடம், "DeepSeek இன் கட்டமைப்பு புதுமையை நிரூபிக்கிறது, இருப்பினும் அது ஒரு LLM ஆகவே உள்ளது. DeepSeek க்கான எங்கள் தழுவல் முதன்மையாக பகுத்தறிவு பயன்பாடுகளில் கவனம் செலுத்துகிறது, தொழில்நுட்ப செயல்படுத்தலை மிகவும் நேரடியானதாகவும் விரைவாகவும் செய்கிறது." இருப்பினும், MoE அணுகுமுறை சேமிப்பு மற்றும் விநியோகம் அடிப்படையில் அதிக கோரிக்கைகளை கோருகிறது, உள்நாட்டு சில்லுகளுடன் பயன்படுத்தும்போது இணக்கத்தன்மையை உறுதி செய்வதோடு, தழுவலின் போது தீர்வு தேவைப்படும் ஏராளமான பொறியியல் சவால்களை முன்வைக்கிறது. "தற்போது, உள்நாட்டு கணக்கீட்டு சக்தி பயன்பாடு மற்றும் நிலைத்தன்மையில் Nvidia உடன் பொருந்தவில்லை, மென்பொருள் சூழல் அமைப்பு, சரிசெய்தல் மற்றும் அடிப்படை செயல்திறன் உகப்பாக்கம் ஆகியவற்றிற்கான அசல் தொழிற்சாலை பங்கேற்பு தேவைப்படுகிறது," என்று ஒரு தொழில்துறை பயிற்சியாளர் நடைமுறை அனுபவத்தின் அடிப்படையில் கூறினார். அதே நேரத்தில், "DeepSeek R1 இன் பெரிய அளவுரு அளவுகோல் காரணமாக, உள்நாட்டு கணக்கீட்டு சக்திக்கு இணையாக மாற்றுவதற்கு அதிக முனைகள் தேவைப்படுகின்றன. கூடுதலாக, உள்நாட்டு வன்பொருள் விவரக்குறிப்புகள் இன்னும் ஓரளவு பின்தங்கியுள்ளன; எடுத்துக்காட்டாக, Huawei 910B தற்போது DeepSeek அறிமுகப்படுத்திய FP8 அனுமானத்தை ஆதரிக்க முடியாது." DeepSeek V3 மாதிரியின் சிறப்பம்சங்களில் ஒன்று FP8 கலப்பு துல்லிய பயிற்சி கட்டமைப்பை அறிமுகப்படுத்துவதாகும், இது மிகப் பெரிய மாதிரியில் திறம்பட சரிபார்க்கப்பட்டுள்ளது, இது ஒரு குறிப்பிடத்தக்க சாதனையைக் குறிக்கிறது. முன்னதாக, மைக்ரோசாப்ட் மற்றும் என்விடியா போன்ற முக்கிய வீரர்கள் தொடர்புடைய பணிகளை பரிந்துரைத்தனர், ஆனால் சாத்தியக்கூறு குறித்து தொழில்துறையில் சந்தேகங்கள் நீடிக்கின்றன. INT8 உடன் ஒப்பிடும்போது, FP8 இன் முதன்மை நன்மை என்னவென்றால், பயிற்சிக்குப் பிந்தைய அளவீடு கிட்டத்தட்ட இழப்பற்ற துல்லியத்தை அடைய முடியும், அதே நேரத்தில் அனுமான வேகத்தை கணிசமாக அதிகரிக்கிறது. FP16 உடன் ஒப்பிடும்போது, FP8 Nvidia இன் H20 இல் இரண்டு மடங்கு முடுக்கம் மற்றும் H100 இல் 1.5 மடங்கு முடுக்கத்தை உணர முடியும். குறிப்பாக, உள்நாட்டு கணக்கீட்டு சக்தி மற்றும் உள்நாட்டு மாதிரிகளின் போக்கைச் சுற்றியுள்ள விவாதங்கள் வேகத்தைப் பெறுவதால், Nvidia சீர்குலைக்கப்படுமா, CUDA அகழியைத் தவிர்க்க முடியுமா என்பது பற்றிய ஊகங்கள் பெருகி வருகின்றன. மறுக்க முடியாத ஒரு உண்மை என்னவென்றால், DeepSeek உண்மையில் Nvidia இன் சந்தை மதிப்பில் கணிசமான வீழ்ச்சியை ஏற்படுத்தியுள்ளது, ஆனால் இந்த மாற்றம் Nvidia இன் உயர்நிலை கணக்கீட்டு சக்தி ஒருமைப்பாடு குறித்த கேள்விகளை எழுப்புகிறது. மூலதனத்தால் இயக்கப்படும் கணக்கீட்டு குவிப்பு தொடர்பான முன்னர் ஏற்றுக்கொள்ளப்பட்ட விவரிப்புகள் சவால் செய்யப்படுகின்றன, இருப்பினும் பயிற்சி சூழ்நிலைகளில் Nvidiaவை முழுமையாக மாற்றுவது இன்னும் கடினமாக உள்ளது. DeepSeek இன் CUDA இன் ஆழமான பயன்பாட்டின் பகுப்பாய்வு, வழக்கமான GPU களுக்கு இடமளிக்கும் நெகிழ்வுத்தன்மை - தகவல்தொடர்புக்கு SM ஐப் பயன்படுத்துவது அல்லது நெட்வொர்க் கார்டுகளை நேரடியாக கையாளுவது போன்றவை - சாத்தியமில்லை என்பதைக் காட்டுகிறது. Nvidia இன் அகழி CUDA ஐ விட முழு CUDA சுற்றுச்சூழல் அமைப்பையும் உள்ளடக்கியது என்றும், DeepSeek பயன்படுத்தும் PTX (Parallel Thread Execution) வழிமுறைகள் இன்னும் CUDA சுற்றுச்சூழல் அமைப்பின் ஒரு பகுதியாகும் என்றும் தொழில்துறை கண்ணோட்டங்கள் வலியுறுத்துகின்றன. "குறுகிய காலத்தில், Nvidia இன் கணக்கீட்டு சக்தியைத் தவிர்க்க முடியாது - இது பயிற்சியில் குறிப்பாகத் தெளிவாக உள்ளது; இருப்பினும், பகுத்தறிவுக்காக உள்நாட்டு அட்டைகளைப் பயன்படுத்துவது ஒப்பீட்டளவில் எளிதாக இருக்கும், எனவே முன்னேற்றம் விரைவாக இருக்கும். உள்நாட்டு அட்டைகளின் தழுவல் முதன்மையாக அனுமானத்தில் கவனம் செலுத்துகிறது; உள்நாட்டு அட்டைகளில் DeepSeek இன் செயல்திறனின் மாதிரியை அளவில் பயிற்றுவிக்க இதுவரை யாரும் நிர்வகிக்கவில்லை," என்று ஒரு தொழில்துறை ஆய்வாளர் AI தொழில்நுட்ப மதிப்பாய்விடம் குறிப்பிட்டார். ஒட்டுமொத்தமாக, ஒரு அனுமானக் கண்ணோட்டத்தில், சூழ்நிலைகள் உள்நாட்டு பெரிய மாதிரி சில்லுகளுக்கு ஊக்கமளிக்கின்றன. பயிற்சியின் அதிகப்படியான தேவைகள் காரணமாக, உள்நாட்டில் உள்ள சிப் உற்பத்தியாளர்களுக்கான வாய்ப்புகள் அதிகமாகத் தெரிகின்றன, இது நுழைவைத் தடுக்கிறது. உள்நாட்டு அனுமான அட்டைகளைப் பயன்படுத்துவது போதுமானது என்று ஆய்வாளர்கள் வாதிடுகின்றனர்; தேவைப்பட்டால், கூடுதல் இயந்திரத்தைப் பெறுவது சாத்தியமாகும், அதேசமயம் பயிற்சி மாதிரிகள் தனித்துவமான சவால்களை ஏற்படுத்துகின்றன - அதிக எண்ணிக்கையிலான இயந்திரங்களை நிர்வகிப்பது சுமையாக மாறும், மேலும் அதிக பிழை விகிதங்கள் பயிற்சி விளைவுகளை எதிர்மறையாக பாதிக்கும். பயிற்சிக்கு குறிப்பிட்ட கிளஸ்டர் அளவிலான தேவைகளும் உள்ளன, அதே நேரத்தில் அனுமானத்திற்கான கிளஸ்டர்களுக்கான கோரிக்கைகள் அவ்வளவு கடுமையானவை அல்ல, இதனால் GPU தேவைகளை எளிதாக்குகிறது. தற்போது, என்விடியாவின் ஒற்றை H20 அட்டையின் செயல்திறன் Huawei அல்லது Cambrian ஐ விட அதிகமாக இல்லை; அதன் வலிமை கிளஸ்டரிங்கில் உள்ளது. கணக்கீட்டு சக்தி சந்தையில் ஒட்டுமொத்த தாக்கத்தின் அடிப்படையில், லுச்சென் டெக்னாலஜியின் நிறுவனர் யூ யாங், AI டெக்னாலஜி ரிவியூவுக்கு அளித்த பேட்டியில், "டீப்சீக் தற்காலிகமாக அல்ட்ரா-லார்ஜ் பயிற்சி கணக்கீட்டு கிளஸ்டர்களின் நிறுவலையும் வாடகையையும் குறைமதிப்பிற்கு உட்படுத்தக்கூடும். நீண்ட காலத்திற்கு, பெரிய மாதிரி பயிற்சி, பகுத்தறிவு மற்றும் பயன்பாடுகளுடன் தொடர்புடைய செலவுகளை கணிசமாகக் குறைப்பதன் மூலம், சந்தை தேவை அதிகரிக்கும். இதன் அடிப்படையில் AI இன் அடுத்தடுத்த மறு செய்கைகள் கணக்கீட்டு சக்தி சந்தையில் நிலையான தேவையை தொடர்ந்து அதிகரிக்கும்." கூடுதலாக, "DeepSeek இன் பகுத்தறிவு மற்றும் நேர்த்தியான-சரிப்படுத்தும் சேவைகளுக்கான அதிகரித்த தேவை, உள்நாட்டு கணக்கீட்டு நிலப்பரப்புடன் மிகவும் இணக்கமானது, அங்கு உள்ளூர் திறன்கள் ஒப்பீட்டளவில் பலவீனமாக உள்ளன, கிளஸ்டர் நிறுவலுக்குப் பிறகு செயலற்ற வளங்களிலிருந்து வீணாவதைக் குறைக்க உதவுகின்றன; இது உள்நாட்டு கணக்கீட்டு சுற்றுச்சூழல் அமைப்பின் பல்வேறு நிலைகளில் உற்பத்தியாளர்களுக்கு சாத்தியமான வாய்ப்புகளை உருவாக்குகிறது." உள்நாட்டு கணக்கீட்டு சக்தியை அடிப்படையாகக் கொண்ட DeepSeek R1 தொடர் பகுத்தறிவு APIகள் மற்றும் கிளவுட் இமேஜிங் சேவைகளை அறிமுகப்படுத்த லுச்சென் டெக்னாலஜி ஹவாய் கிளவுட் உடன் இணைந்து செயல்படுகிறது. எதிர்காலத்தைப் பற்றி யூ யாங் நம்பிக்கை தெரிவித்தார்: "DeepSeek உள்நாட்டில் தயாரிக்கப்பட்ட தீர்வுகளில் நம்பிக்கையைத் தூண்டுகிறது, எதிர்காலத்தில் உள்நாட்டு கணக்கீட்டு திறன்களில் அதிக உற்சாகத்தையும் முதலீட்டையும் ஊக்குவிக்கிறது."

முடிவுரை
ChatGPT-ஐ விட DeepSeek "சிறந்ததா" என்பது பயனரின் குறிப்பிட்ட தேவைகள் மற்றும் நோக்கங்களைப் பொறுத்தது. நெகிழ்வுத்தன்மை, குறைந்த செலவு மற்றும் தனிப்பயனாக்கம் தேவைப்படும் பணிகளுக்கு, DeepSeek சிறந்ததாக இருக்கலாம். படைப்பு எழுத்து, பொது விசாரணை மற்றும் பயனர் நட்பு உரையாடல் இடைமுகங்களுக்கு, ChatGPT முன்னிலை வகிக்கலாம். ஒவ்வொரு கருவியும் வெவ்வேறு நோக்கங்களுக்கு உதவுகிறது, எனவே தேர்வு அவை பயன்படுத்தப்படும் சூழலைப் பொறுத்தது.
கட்டுப்பாட்டு கேபிள்கள்
கட்டமைக்கப்பட்ட கேபிளிங் அமைப்பு
நெட்வொர்க் & டேட்டா, ஃபைபர்-ஆப்டிக் கேபிள், பேட்ச் கார்டு, மாட்யூல்கள், ஃபேஸ்ப்ளேட்
ஏப்ரல் 16-18, 2024 துபாயில் மத்திய கிழக்கு-ஆற்றல்
ஏப்ரல் 16-18, 2024 மாஸ்கோவில் செகுரிகா
மே.9, 2024 ஷாங்காயில் புதிய தயாரிப்புகள் & தொழில்நுட்பங்கள் வெளியீட்டு நிகழ்வு
அக்டோபர் 22-25, 2024 பெய்ஜிங்கில் பாதுகாப்பு சீனா
நவம்பர் 19-20, 2024 இணைக்கப்பட்ட உலகம் சௌதி அரேபியா
இடுகை நேரம்: பிப்ரவரி-10-2025