Google I/O 2024 ने गूगल ने बहुत सारे न्यू अपडेट और AI के रिलीटेड न्यूज दिए। Google I/O 2024 मंगलवार 14 May 2024 राते 9 बजे था। गूगल अपने इवेंट में AI वर्ड का काफी यूज किया। रेसेंटल CHAT4o लुआंच बाद गूगल ने रेस आगे रेने के लिए अपने कई Ai मॉडल लॉन्च कर ने का इवेंट में बताया। Gemma,Gemini 1.5, Gemini Flash, Android 15 का अपडेट जल्दी यूजर को मिलेगा।
हमने Gemini 1.5 Flash पेश किया: एक हल्का मॉडल जिसे बड़े पैमाने पर सेवा देने के लिए तेज़ और कुशल बनाया गया है Gemini 1.5 Flash API में दिया जाने वाला सबसे तेज़ Gemini मॉडल है।
हमने Gemini 1.5 Pro में काफ़ी सुधार किया है, जो कि कई तरह के कार्यों में सामान्य प्रदर्शन के लिए हमारा सबसे अच्छा मॉडल है।
Gemini 1.5Pro और Gemini 1.5 Flash दोनों ही Google AI Studio और Vertex AI पर 1 मिलियन टोकन संदर्भ विंडो के साथ सार्वजनिक पूर्वावलोकन में उपलब्ध हैं।
Gemini 1.5Pro, Google AI Studio और Vertex AI में वेटलिस्ट के ज़रिए डेवलपर्स के लिए 2 मिलियन टोकन संदर्भ विंडो के साथ भी उपलब्ध है।
Gemini 1.5 की 2 मिलियन टोकन क्षमता की तुलना में अग्रणी फ़ाउंडेशन मॉडल की संदर्भ लंबाई।
. हमने प्रोजेक्ट एस्ट्रा को साझा किया: AI सहायकों के भविष्य के लिए हमारा दृष्टिकोण।
. हमने अपने कस्टम AI एक्सेलेरेटर, टेंसर प्रोसेसिंग यूनिट (TPU) की छठी पीढ़ी, ट्रिलियम की घोषणा की। यह अब तक का सबसे ज़्यादा प्रदर्शन करने वाला TPU है।
TPU v5e की तुलना में, Trillium TPUs प्रति चिप अधिकतम कंप्यूट प्रदर्शन में 4.7x की वृद्धि प्राप्त करते हैं।
. वे हमारी सबसे संधारणीय पीढ़ी भी हैं: TPU v5e की तुलना में Trillium TPUs 67% से अधिक ऊर्जा-कुशल हैं।
और हमने NotebookLM के लिए ऑडियो ओवरव्यू का एक प्रारंभिक प्रोटोटाइप प्रदर्शित किया, जो उपयोगकर्ता के लिए वैयक्तिकृत मौखिक चर्चा बनाने के लिए अपलोड की गई सामग्रियों के संग्रह का उपयोग करता है।
हमने घोषणा की कि Google खोज के साथ ग्राउंडिंग – एक उपकरण जो जेमिनी मॉडल को विश्व ज्ञान, विषयों की एक विस्तृत संभावित श्रेणी या इंटरनेट पर अद्यतित जानकारी से जोड़ता है – अब आम तौर पर Vertex AI पर उपलब्ध है।
. हमने जेमिनी API और AI स्टूडियो में ऑडियो समझ को जोड़ा, इसलिए जेमिनी 1.5 प्रो अब AI स्टूडियो में अपलोड किए गए वीडियो के लिए छवि और ऑडियो के बीच तर्क कर सकता है।
पिक्सेल से शुरू करते हुए, मल्टीमोडैलिटी के साथ जेमिनी नैनो का उपयोग करने वाले एप्लिकेशन दुनिया को उसी तरह समझ पाएंगे जिस तरह लोग समझते हैं – न केवल टेक्स्ट इनपुट के माध्यम से बल्कि दृष्टि, ध्वनि और बोली जाने वाली भाषा के माध्यम से भी।
जनरेटिव मीडिया मॉडल और लैब प्रयोग (Google I/O 2024)
हमने इमेजन 3 की घोषणा की, जो अब तक का हमारा सबसे उच्च-गुणवत्ता वाला इमेज जनरेशन मॉडल है।
. इमेजन 3 आपके प्रॉम्प्ट के पीछे की प्राकृतिक भाषा और इरादे को समझता है और लंबे प्रॉम्प्ट से छोटे विवरणों को शामिल करता है। यह इसे अविश्वसनीय स्तर का विवरण उत्पन्न करने में मदद करता है, जो हमारे पिछले मॉडल की तुलना में बहुत कम विचलित करने वाले विज़ुअल आर्टिफ़ैक्ट के साथ फ़ोटोरियलिस्टिक, जीवंत छवियां बनाता है।
. इमेजन 3 टेक्स्ट रेंडर करने के लिए हमारा अब तक का सबसे अच्छा मॉडल है – इमेज जनरेशन मॉडल के लिए एक चुनौती।
हमने इमेजन 3 को इमेजएफएक्स में विश्वसनीय परीक्षकों के लिए रोल आउट किया और आप प्रतीक्षा सूची में शामिल होने के लिए साइन अप कर सकते हैं।
. इमेजन 3 इस गर्मी में वर्टेक्स एआई में भी आएगा।
. फिर हमने वीओ की घोषणा की, जो अब तक का हमारा सबसे सक्षम वीडियो जनरेशन मॉडल है। यह उच्च-गुणवत्ता वाले 1080p रिज़ॉल्यूशन वाले वीडियो बनाता है जो एक मिनट से ज़्यादा समय तक चल सकते हैं, सिनेमाई और विज़ुअल शैलियों की एक विस्तृत श्रृंखला में।
. हम भविष्य में वीओ की कुछ क्षमताओं को YouTube शॉर्ट्स और अन्य उत्पादों में भी लाएंगे।
. हमने दिखाया कि फिल्म निर्माताओं के साथ सहयोग करके Veo कलाकारों की क्या मदद कर सकता है – जिसमें डोनाल्ड ग्लोवर भी शामिल हैं, जिन्होंने एक फिल्म प्रोजेक्ट के लिए Veo के साथ प्रयोग किया था।
. हमने म्यूजिक AI सैंडबॉक्स पर प्रकाश डाला, जो म्यूजिक AI टूल का एक सूट है जो लोगों को स्क्रैच से नए इंस्ट्रूमेंटल सेक्शन बनाने, ट्रैकर्स के बीच स्टाइल ट्रांसफर करने और बहुत कुछ करने की अनुमति देता है। आप इन सहयोगों से कुछ बिल्कुल नए गाने पा सकते हैं – जिसमें वायक्लेफ जीन का एक और मार्क रेबिलेट का एक और शामिल है – अब YouTube पर।
. और इनफिनिट वंडरलैंड को देखना न भूलें, एक ऐसा अनुभव जहां कलाकारों और Google क्रिएटिव ने उपन्यास “ऐलिस एडवेंचर्स इन वंडरलैंड” की दृश्य दुनिया को अंतहीन रूप से फिर से कल्पना करने के लिए एक AI मॉडल को ठीक करने के लिए एक साथ प्रयोग किया। इनफिनिट वंडरलैंड के पाठक प्रत्येक कलाकार की संबंधित शैली के आधार पर पुस्तक में 1,200 वाक्यों में से प्रत्येक के लिए प्रतीत होने वाली अनंत छवियां उत्पन्न कर सकते हैं।
. हमने VideoFX की घोषणा की, हमारा सबसे नया प्रायोगिक उपकरण जो Google DeepMind के जनरेटिव वीडियो मॉडल, Veo का उपयोग करता है, और आपको किसी विचार को वीडियो क्लिप में बदलने देता है।
. यह एक स्टोरीबोर्ड मोड के साथ भी आता है जो आपको दृश्य दर दृश्य दोहराने और अपने अंतिम वीडियो में संगीत जोड़ने देता है।
. हमने ImageFX में और अधिक संपादकीय नियंत्रण जोड़े हैं – समुदाय से एक शीर्ष सुविधा अनुरोध – ताकि आप अपनी छवि पर बस ब्रश करके तत्वों को जोड़, हटा या बदल सकें।
ImageFX इमेजन 3 का उपयोग करके अधिक फोटोरियलिज्म को समृद्ध विवरण और कम दृश्य कलाकृतियों और अधिक सटीक टेक्स्ट रेंडरिंग के साथ अनलॉक करेगा।
. MusicFX में “DJ मोड” नामक एक नई सुविधा है जो आपको संगीत कहानियों को जीवंत करने के लिए जनरेटिव AI की शक्ति का उपयोग करके शैलियों और उपकरणों को मिलाकर बीट्स को मिलाने में मदद करती है।
. इस सप्ताह से, ImageFX और MusicFX अब लैब्स के माध्यम से 100 से अधिक देशों में उपलब्ध हैं।
Gemini ऐप के साथ अधिक काम करने के नए तरीके (Google I/O 2024)
हम Gemini Advanced ग्राहकों के लिए Gemini 1.5 Pro, हमारा अत्याधुनिक मॉडल ला रहे हैं – जिसका अर्थ है कि Gemini Advanced में अब 1 मिलियन टोकन संदर्भ विंडो है और यह 1,500-पृष्ठ PDF को समझने जैसे काम कर सकता है।
. इसका यह भी अर्थ है कि Gemini Advanced में अब दुनिया में किसी भी व्यावसायिक रूप से उपलब्ध चैटबॉट की सबसे बड़ी संदर्भ विंडो है।
. हमने Google Drive के माध्यम से या सीधे अपने डिवाइस से सीधे Gemini Advanced में फ़ाइलें अपलोड करने की क्षमता जोड़ी है।
. जल्द ही, जेमिनी एडवांस्ड आपको अपने डेटा का विश्लेषण करने में मदद करेगा ताकि आप जल्दी से अंतर्दृष्टि प्राप्त कर सकें और स्प्रेडशीट जैसी अपलोड की गई डेटा फ़ाइलों से चार्ट बना सकें।
. यात्रियों के लिए अच्छी खबर: जेमिनी एडवांस्ड में एक नई योजना सुविधा है जो सुझाई गई गतिविधियों की सूची से परे जाती है और वास्तव में आपके लिए एक कस्टम यात्रा कार्यक्रम बनाएगी।
. फिर जेमिनी एडवांस्ड सब्सक्राइबर्स के लिए जेमिनी लाइव है, एक नया, मोबाइल-फर्स्ट संवादात्मक अनुभव जो अत्याधुनिक स्पीच तकनीक का उपयोग करके आपको जेमिनी के साथ अधिक स्वाभाविक, सहज मौखिक बातचीत करने में मदद करता है।
. जेमिनी लाइव आपको 10 प्राकृतिक-ध्वनि वाली आवाज़ों में से चुनने देता है, जिसके साथ यह आपको जवाब दे सकता है; साथ ही, आप अपनी गति से बोल सकते हैं या स्पष्टीकरण प्रश्नों के साथ बीच-बीच में प्रतिक्रिया दे सकते हैं।
. Google संदेशों में जेमिनी अब आपको उसी ऐप में जेमिनी के साथ चैट करने देता है जहाँ आप अपने दोस्तों को संदेश भेजते हैं।
. जेमिनी एडवांस्ड सब्सक्राइबर्स जल्द ही जेम बना पाएँगे, जो जेमिनी के कस्टमाइज़ किए गए वर्शन हैं जो आपके सपनों के हिसाब से डिज़ाइन किए गए हैं। बस यह बताएं कि आप अपने जेम से क्या करवाना चाहते हैं और आप चाहते हैं कि वह किस तरह से प्रतिक्रिया दे और जेमिनी उन निर्देशों को लेगा और आपकी विशिष्ट आवश्यकताओं के लिए जेम बनाएगा।
. और जेमिनी से जुड़े और भी Google टूल देखें, जिनमें Google कैलेंडर, टास्क, कीप और क्लॉक शामिल हैं।
हम Google सर्च के लिए अनुकूलित एक नए जेमिनी मॉडल का उपयोग कर रहे हैं ताकि जेमिनी की उन्नत क्षमताओं को एक साथ लाया जा सके – जिसमें मल्टी-स्टेप रीजनिंग, प्लानिंग और मल्टीमोडैलिटी शामिल है – हमारे सर्वश्रेष्ठ-इन-क्लास सर्च सिस्टम के साथ।
. सर्च में AI ओवरव्यू इस सप्ताह से यू.एस. में सभी के लिए शुरू हो रहे हैं और जल्द ही और देशों में भी शुरू होने वाले हैं।
और यू.एस. में अंग्रेजी क्वेरी के लिए सर्च लैब्स में AI ओवरव्यू में जल्द ही मल्टी-स्टेप रीजनिंग क्षमताएँ आने वाली हैं। इसलिए अपने प्रश्न को कई खोजों में विभाजित करने के बजाय, आप जटिल प्रश्न पूछ सकते हैं जैसे “बोस्टन में सबसे अच्छे योग या पिलेट्स स्टूडियो खोजें और उनके परिचय प्रस्तावों और बीकन हिल से चलने के समय के बारे में विवरण दिखाएँ।”
. जल्द ही, जब आप किसी विषय के बारे में नए हों या किसी विषय के मूल तक पहुँचने का प्रयास कर रहे हों, तो आप भाषा को सरल बनाने या उसे अधिक विस्तार से विभाजित करने के विकल्पों के साथ अपने AI अवलोकन को समायोजित करने में सक्षम होंगे।
. सर्च में नई नियोजन क्षमताएँ भी मिल रही हैं। उदाहरण के लिए, कस्टमाइज़ेशन के साथ भोजन और यात्रा की योजना इस साल के अंत में सर्च लैब्स में लॉन्च होगी, इसके बाद जल्द ही पार्टियों और फिटनेस जैसी और श्रेणियाँ भी लॉन्च होंगी।
. वीडियो समझ में प्रगति के लिए धन्यवाद, अब आपके पास वीडियो के साथ प्रश्न पूछने की क्षमता है। सर्च एक जटिल विज़ुअल प्रश्न ले सकता है और आपके लिए उसका हल निकाल सकता है, फिर अगले चरणों की व्याख्या कर सकता है और AI अवलोकन के साथ संसाधन प्रदान कर सकता है।
. और जल्द ही, सर्च में जेनरेटिव AI नए विचारों की खोज करते समय एक AI-संगठित परिणाम पृष्ठ भी बनाएगा। ये AI-संगठित खोज परिणाम पृष्ठ तब उपलब्ध होंगे जब आप भोजन, व्यंजन, फ़िल्में, संगीत, पुस्तकें, होटल, खरीदारी और बहुत कुछ जैसी श्रेणियों की खोज करेंगे।
वर्कस्पेस और फोटो में जेमिनी मॉडल से सहायता(Google I/O 2024)
जेमिनी 1.5 प्रो अब वर्कस्पेस लैब्स के माध्यम से जीमेल, डॉक्स, ड्राइव, स्लाइड्स और शीट्स में साइड पैनल में उपलब्ध है – और यह अगले महीने वर्कस्पेस ग्राहकों और Google One AI प्रीमियम ग्राहकों के लिए हमारे जेमिनी के लिए उपलब्ध होगा।
. आप सबसे महत्वपूर्ण विवरण और कार्रवाई आइटम प्राप्त करने के लिए ईमेल को सारांशित करने के लिए जीमेल के साइड पैनल का उपयोग करने में सक्षम होंगे।
. सारांशों के अलावा, जीमेल का मोबाइल ऐप जल्द ही दो अन्य नई सुविधाओं के लिए जेमिनी का उपयोग करेगा: प्रासंगिक स्मार्ट उत्तर और जीमेल क्यू एंड ए।
. आने वाले हफ्तों में, जीमेल और डॉक्स में लिखने में मेरी सहायता करें स्पेनिश और पुर्तगाली का समर्थन करेगा।
. इस साल के अंत में लैब्स में, आप जेमिनी को ड्राइव में ईमेल अटैचमेंट को स्वचालित रूप से व्यवस्थित करने, डेटा के साथ एक शीट बनाने और फिर डेटा क्यू एंड ए के साथ इसका विश्लेषण करने के लिए भी कह सकते हैं।
Google फ़ोटो में Ask Photos नामक एक नया प्रायोगिक फ़ीचर आपकी गैलरी में शामिल विशिष्ट यादों या याद की गई जानकारी को ढूँढ़ना और भी आसान बनाता है। यह फ़ीचर Gemini मॉडल का उपयोग करता है, और इसे आने वाले महीनों में शुरू किया जाएगा।
आप Ask Photos का उपयोग हाल ही की यात्रा से हाइलाइट गैलरी बनाने के लिए भी कर सकते हैं, और यह आपके लिए सोशल मीडिया पर साझा करने के लिए वैयक्तिकृत कैप्शन भी लिखेगा।
Android में उन्नति(Google I/O 2024)
इस साल के अंत में Pixel से शुरू होकर, Gemini Nano – Android का बिल्ट-इन, ऑन-डिवाइस फ़ाउंडेशन मॉडल – में मल्टीमॉडल क्षमताएँ होंगी। सिर्फ़ टेक्स्ट इनपुट को प्रोसेस करने से परे, आपका Pixel फ़ोन दृश्य, ध्वनि और बोली जाने वाली भाषा जैसे संदर्भ में अधिक जानकारी को समझने में भी सक्षम होगा।
. Talkback, Android डिवाइस के लिए एक एक्सेसिबिलिटी फ़ीचर जो अंधे और कम दृष्टि वाले लोगों को अपने डिवाइस के साथ बेहतर तरीके से इंटरैक्ट करने के लिए टच और बोले गए फ़ीडबैक का उपयोग करने में मदद करता है, इसे मल्टीमॉडलिटी के साथ Gemini Nano की बदौलत बेहतर बनाया जा रहा है।
. एक नया, ऑप्ट-इन स्कैम प्रोटेक्शन फ़ीचर जो Gemini Nano के ऑन-डिवाइस AI का उपयोग करके गोपनीयता को बनाए रखते हुए स्कैम फ़ोन कॉल का पता लगाने में मदद करेगा। इस वर्ष के अंत में अधिक जानकारी के लिए देखें।
. हमने घोषणा की है कि Circle to Search वर्तमान में 100 मिलियन से अधिक Android डिवाइस पर उपलब्ध है, और हम वर्ष के अंत तक इसे दोगुना करने की दिशा में आगे बढ़ रहे हैं।
. जल्द ही, आप Android पर Gemini का उपयोग करके जेनरेट की गई छवियों को Gmail, Google संदेश और अन्य में ड्रैग और ड्रॉप कर सकेंगे, या आप जो YouTube वीडियो देख रहे हैं उसके बारे में पूछ सकेंगे।
. यदि आपके पास Gemini Advanced है, तो आपके पास कई पृष्ठों को स्क्रॉल किए बिना तुरंत उत्तर पाने के लिए “इस PDF से पूछें” का विकल्प भी होगा।
. छात्र अब चुनिंदा Android फ़ोन और टैबलेट से सीधे होमवर्क सहायता के लिए Circle to Search का उपयोग कर सकते हैं। यह सुविधा LearnLM द्वारा संचालित है – सीखने के लिए तैयार किए गए Gemini पर आधारित हमारे नए मॉडल परिवार।
. इस वर्ष के अंत में, Circle to Search प्रतीकात्मक फ़ार्मुलों, आरेखों, ग्राफ़ और बहुत कुछ से जुड़ी और भी जटिल समस्याओं को हल करने में सक्षम होगा।
. ओह, और हमने Android 15 का दूसरा बीटा पेश किया है।
. चोरी का पता लगाने वाला लॉक शक्तिशाली Google AI का उपयोग करके यह पता लगाता है कि आपका डिवाइस छीना गया है या नहीं और आपके फ़ोन पर आपकी जानकारी को तुरंत लॉक कर देता है।
. Android 15 में निजी स्थान आ रहा है, जो आपको एक अलग स्थान के अंदर सुरक्षित रखने के लिए ऐप चुनने देता है, जिसे खोलने के लिए प्रमाणीकरण की एक अतिरिक्त परत की आवश्यकता होती है।
. और यदि आपके निजी स्थानों के लिए एक अलग लॉक स्क्रीन पर्याप्त नहीं है, तो आप इसके अस्तित्व को पूरी तरह से छिपा सकते हैं।
. इस वर्ष के अंत में, Google Play Protect उन ऐप्स को पहचानने में मदद करने के लिए ऑन-डिवाइस AI का उपयोग करेगा जो धोखाधड़ी या फ़िशिंग में संलग्न होने के लिए अपनी गतिविधियों को छिपाने का प्रयास करते हैं।
. हम Google संदेशों में RCS के साथ जापान में एक अपडेटेड मैसेजिंग अनुभव ला रहे हैं।
. जल्द ही यू.एस. में, आप पास का एक डिजिटल संस्करण बना पाएंगे जिसमें केवल टेक्स्ट होगा। बस पास की एक तस्वीर लें (जैसे बीमा कार्ड या ईवेंट टिकट) और त्वरित पहुँच के लिए इसे आसानी से अपने Google वॉलेट में जोड़ें।
. हमने दिखाया कि कैसे संवर्धित वास्तविकता सामग्री सीधे Google मैप्स में उपलब्ध होगी, जो विस्तारित वास्तविकता (XR) प्लेटफ़ॉर्म की नींव रखेगी जिसे हम Android पारिस्थितिकी तंत्र के लिए Samsung और Qualcomm के सहयोग से बना रहे हैं।
. अब आप Max और Peacock पर अपने पसंदीदा शो के एपिसोड देख सकते हैं या Google बिल्ट-इन वाली चुनिंदा कारों पर Angry Birds का गेम शुरू कर सकते हैं।
. हम आने वाले महीनों में Rivian से शुरू करते हुए Android Automotive OS वाली कारों में Google Cast भी ला रहे हैं, ताकि आप अपने फ़ोन से वीडियो सामग्री को आसानी से कार में कास्ट कर सकें।
इस साल के अंत में, Wear OS 5 वाली घड़ियों में बैटरी लाइफ़ ऑप्टिमाइज़ेशन आने वाले हैं। उदाहरण के लिए, Wear OS 4 वाली घड़ियों की तुलना में आउटडोर मैराथन दौड़ने में 20% तक कम बिजली की खपत होगी।
. Wear OS 5 फिटनेस ऐप्स को ग्राउंड कॉन्टैक्ट टाइम, स्ट्राइड लेंथ और वर्टिकल ऑसिलेशन जैसे अधिक डेटा प्रकारों का समर्थन करने का विकल्प भी देगा।
. हमारे जेमिनी मॉडल की बदौलत अब यह चुनना आसान हो गया है कि Google TV और अन्य Android TV OS डिवाइस पर क्या देखना है, जिसमें व्यक्तिगत AI-जनरेटेड विवरण हैं।
. ये AI-जनरेटेड विवरण फिल्मों और शो के लिए गायब या अनूदित विवरणों को भी भर देंगे।
. यहाँ एक मजेदार आँकड़ा है: लॉन्च के बाद से, लोगों ने 1 बिलियन से अधिक फास्ट पेयर कनेक्शन बनाए हैं।
इस महीने के आखिर में, आप Chipolo और PebbleBee (आने वाले समय में और भी भागीदार) के ब्लूटूथ ट्रैकर टैग के साथ Find My Device ऐप में अपनी चाबियाँ, वॉलेट या लगेज जैसी वस्तुओं को कनेक्ट करने और खोजने के लिए Fast Pair का उपयोग कर पाएँगे।
डेवलपर्स के लिए विकास (Google I/O 2024)
आप Gemini API डेवलपर प्रतियोगिता में शामिल हो सकते हैं और सबसे मददगार और ग्राउंडब्रेकिंग AI ऐप की खोज का हिस्सा बन सकते हैं। पुरस्कार: एक इलेक्ट्रिकली रेट्रोफिटेड कस्टम 1981 DeLorean।
. हमने PaliGemma पेश किया, जो हमारा पहला विज़न-लैंग्वेज ओपन मॉडल है जिसे विज़ुअल Q&A और इमेज कैप्शनिंग के लिए अनुकूलित किया गया है।
. हमने Gemma के अगले संस्करण, Gemma 2 का पूर्वावलोकन किया। यह एक पूरी तरह से नए आर्किटेक्चर पर बनाया गया है और इसमें एक बड़ा 27B पैरामीटर इंस्टेंस शामिल होगा जो अपने आकार से दोगुने मॉडल से बेहतर प्रदर्शन करता है और एक ही TPU होस्ट पर चलता है।
. Android Studio, IDX, Firebase, Colab, VSCode, Cloud और Intellj में डेवलपर्स को अधिक उत्पादक बनाने में मदद करने के लिए अब Gemini मॉडल उपलब्ध हैं।
. Gemini 1.5 Pro इस साल के आखिर में Android Studio में आ रहा है। बड़ी संदर्भ विंडो से लैस, यह मॉडल उच्च-गुणवत्ता वाली प्रतिक्रियाओं की ओर ले जाता है और मल्टीमॉडल इनपुट जैसे उपयोग के मामलों को अनलॉक करता है।
. Google AI Studio अब यू.के. और ई.यू. सहित 200 से अधिक देशों में उपलब्ध है।
समानांतर फ़ंक्शन कॉलिंग और वीडियो फ़्रेम निष्कर्षण अब Gemini API द्वारा समर्थित हैं।
. और अगले महीने आने वाले Gemini API में नए संदर्भ कैशिंग फ़ीचर के साथ, आप कम लागत पर अक्सर उपयोग की जाने वाली संदर्भ फ़ाइलों को कैश करके बड़े प्रॉम्प्ट के लिए वर्कफ़्लो को सुव्यवस्थित करने में सक्षम होंगे।
. Android अब डेवलपर्स को प्लेटफ़ॉर्म पर अपने ऐप के व्यावसायिक तर्क को साझा करने में मदद करने के लिए कोटलिन मल्टीप्लेटफ़ॉर्म के लिए प्रथम श्रेणी का समर्थन प्रदान करता है।
. फ़ायरबेस द्वारा संचालित आकार बदलने योग्य एमुलेटर, कंपोज UI चेक मोड और Android डिवाइस स्ट्रीमिंग नए उत्पाद हैं जो सभी फ़ॉर्म फ़ैक्टर के लिए डेवलपर्स की मदद कर सकते हैं।
. Chrome 126 से शुरू होकर, Gemini Nano को Chrome डेस्कटॉप क्लाइंट में बनाया जाएगा।
. बहु-पृष्ठ ऐप्स के लिए ट्रांज़िशन API देखें, एक बहु-प्रतीक्षित सुविधा, अब उपलब्ध है ताकि डेवलपर्स साइट आर्किटेक्चर की परवाह किए बिना आसानी से सहज, तरल ऐप-जैसे नेविगेशन का निर्माण कर सकें।
. प्रोजेक्ट IDX, पूर्ण-स्टैक, मल्टीप्लेटफ़ॉर्म ऐप्स के लिए हमारा नया एकीकृत डेवलपर अनुभव, अब सभी के लिए आज़माने के लिए खुला है।
. फायरबेस ने बीटा में फायरबेस जेनकिट जारी किया, जो डेवलपर्स के लिए अपने ऐप्स में जेनरेटिव AI अनुभव बनाना और भी आसान बना देगा।
. फायरबेस ने फायरबेस डेटा कनेक्ट भी जारी किया, जो डेवलपर्स के लिए फायरबेस के साथ SQL का उपयोग करने का एक नया तरीका है (Google क्लाउड SQL के माध्यम से)। यह न केवल SQL वर्कफ़्लो को फायरबेस में लाएगा, बल्कि डेवलपर्स को लिखने के लिए आवश्यक ऐप कोड की मात्रा को भी कम करेगा।
. हमने जेम्स मैनिका, जेफ डीन और कोरे कावुकुओग्लू के साथ हमारे AI को शक्ति प्रदान करने वाली तकनीक और शोध के बारे में गहन बातचीत में डेवलपर्स को शामिल किया।
जिम्मेदार AI प्रगति(Google I/O 2024)
हम रेड टीमिंग को बढ़ा रहे हैं – एक सिद्ध अभ्यास जहां हम अपनी कमज़ोरियों के लिए अपने सिस्टम का सक्रिय रूप से परीक्षण करते हैं और उन्हें तोड़ने की कोशिश करते हैं – एक नई तकनीक के माध्यम से जिसे हम “AI-सहायता प्राप्त रेड टीमिंग” कहते हैं।
. हम सिंथआईडी को दो नए तौर-तरीकों में भी विस्तारित कर रहे हैं: टेक्स्ट और वीडियो।
. सिंथआईडी टेक्स्ट वॉटरमार्किंग को भी आने वाले महीनों में हमारे अपडेट किए गए जिम्मेदार जनरेटिव AI टूलकिट के माध्यम से ओपन-सोर्स किया जाएगा।
. हमने लर्नएलएम की घोषणा की, जो जेमिनी पर आधारित और सीखने के लिए फाइन-ट्यून्ड मॉडल का एक नया परिवार है। लर्नएलएम पहले से ही हमारे उत्पादों में कई तरह की सुविधाओं को सशक्त बना रहा है, जिसमें जेमिनी, सर्च, यूट्यूब और गूगल क्लासरूम शामिल हैं।
. हम अपने उत्पादों से परे लर्नएलएम को परिष्कृत और विस्तारित करने के लिए कोलंबिया टीचर्स कॉलेज, एरिजोना स्टेट यूनिवर्सिटी, एनवाईयू टिश और खान अकादमी जैसे संस्थानों के विशेषज्ञों के साथ साझेदारी करेंगे।
. और हमने MIT RAISE के साथ मिलकर एक ऑनलाइन कोर्स भी विकसित किया है जो शिक्षकों को कक्षा में जनरेटिव AI का प्रभावी ढंग से उपयोग करने के लिए तैयार करता है।
. हमने ज्ञान को अधिक सुलभ और सुपाच्य बनाने के लिए Illuminate नामक एक नया प्रयोगात्मक उपकरण बनाया है।
. illuminate दो AI-जनरेटेड आवाज़ों से युक्त एक वार्तालाप उत्पन्न कर सकता है, जो शोध पत्रों से प्रमुख अंतर्दृष्टि का अवलोकन प्रदान करता है। आप इसे आज़माने के लिए आज ही labs.google पर साइन अप कर सकते हैं।
All Over Information collection for Google I/O 2024 website
Google Pixel 8A 2024 जेमिनी और मैजिक इरेज़र: पिक्सल 8ए के साथ होश उड़ाने वाले फीचर्स