AI टूल में सामने आई समस्या
Company ने बताया कि उनके AI Tool में एक समस्या आ गई थी। जवाब देते समय वह बिना कारण गॉब्लिन जैसे काल्पनिक जीवों का ज़िक्र करने लगा था। इसी वजह से उन्होंने अपने Codex टूल में भी ऐसे शब्दों पर रोक लगा दी।
नए निर्देश जारी किए गए
Reports के अनुसार, AI को यह निर्देश दिया गया है कि जब तक सवाल से सीधा संबंध न हो, तब तक गॉब्लिन, ग्रेमलिन या किसी भी जानवर या काल्पनिक जीव का जिक्र न किया जाए।
बार-बार हो रहा था काल्पनिक किरदारों का इस्तेमाल
Company ने देखा कि ChatGPT और दूसरे GPT-5 Tool जवाब देते समय उदाहरण देने के लिए बार-बार ऐसे काल्पनिक किरदारों का इस्तेमाल कर रहे थे। शुरुआत में यह ठीक लगा, लेकिन बाद में यह आदत ज्यादा बढ़ गई।
“Nerdy personality” फीचर बना वजह
OpenAI के मुताबिक, यह समस्या “Nerdy personality” नाम के एक फीचर की वजह से आई। इस फीचर में AI को थोड़ा क्रिएटिव और कल्पनाशील बनने के लिए ट्रेन किया गया था, जिससे वह ऐसे उदाहरण ज्यादा देने लगा।
फीचर हटाने के बाद भी असर रहा
हालांकि बाद में इस फीचर को हटा दिया गया, फिर भी AI में यह आदत बनी रही। कंपनी ने माना कि ट्रेनिंग के दौरान ऐसे उदाहरणों को ज्यादा महत्व मिलने की वजह से यह समस्या बढ़ी।
यूजर्स के फीडबैक से हुआ खुलासा
Goblin शब्द का इस्तेमाल अचानक काफी बढ़ गया था, जो सामान्य उपयोग से ज्यादा था। कई यूजर्स ने भी इस strange patterns की शिकायत की और बताया कि AI बार-बार ऐसे काल्पनिक शब्दों का उपयोग कर रहा है। इन फीडबैक को गंभीरता से लेते हुए कंपनी ने विस्तृत विश्लेषण किया और समस्या की जड़ तक पहुंचने की कोशिश की। इसके बाद OpenAI ने जरूरी सुधार शुरू किए, ताकि AI आगे से सिर्फ सही और काम की भाषा ही इस्तेमाल करे।
ट्रेनिंग में किए गए बदलाव
अब OpenAI ने अपने AI मॉडल की training process में जरूरी बदलाव किए हैं, ताकि वह बिना वजह गॉब्लिन जैसे काल्पनिक शब्दों का इस्तेमाल न करे। कंपनी ने ऐसे डेटा और संकेतों (signals) को हटा दिया है जो इन शब्दों को बढ़ावा देते थे। साथ ही, मॉडल को यह सिखाया गया है कि वह सिर्फ सवाल से जुड़े और प्रासंगिक जवाब ही दे। इन सुधारों का मकसद AI की Language को ज्यादा स्पष्ट, सटीक और प्रोफेशनल बनाना है, ताकि Users को हर बार सही और भरोसेमंद जानकारी मिल सके।
AI को सुधारना क्यों जरूरी है
Company का कहना है कि AI का व्यवहार सिर्फ Data पर नहीं, बल्कि उसे कैसे ट्रेन किया गया है इस पर भी निर्भर करता है। इसलिए समय-समय पर उसे सुधारना जरूरी होता है, ताकि यूजर्स को सही और संतुलित जानकारी मिल सके।