Google I/O 2024: Gemini-eran inom sökning - AI kommer att skapa teckningar, videor och musik och varna för telefonbedragare

Av: Viktor Tsyrfa | 15.05.2024, 09:21

På den pågående Google I/O-konferensen visade sökjätten att den inte har för avsikt att släppa sitt ledarskap när det gäller introduktionen av artificiell intelligens. AI kommer att integreras tätare i Google Foto, Google Camera, Gmail, sök och andra appar, och Gemini kommer att bli den primära personliga assistenten som man kan kommunicera med via text, röst och kamera.

Google I/O 2024: höjdpunkter

Gemini kommer nu att bli den ledande assistenten i Android. Inget nytt om Google Assistents öde, men vi känner alla till Googles vanor.
Bildgenerering - enligt den detaljerade beskrivningen kommer Gemini att skapa bilder av till och med icke-existerande objekt. Du kan också skapa vackra bildtexter.
Videogenerering efter beskrivning. Videon kan förlängas till önskad varaktighet. Ett mycket lovande verktyg för bloggare för att få gratis temavideoinlägg.
Music AI Sandbox - ett verktyg för att genom textbeskrivning generera ett musikprov eller bearbeta det ingående ljudspåret.
Google Photo kommer nu att analysera hela sammanhanget för foton. Det kommer inte bara att vara möjligt att söka bilder efter beskrivningen av vad som tas på dem, utan också att göra tematiska urval, till exempel framsteg från träningspass under året etc.
API Gemini 1.5 Pro är en språkmodell som kommer att tillhandahålla 1 miljon tokens för att bearbeta frågor, komma ihåg konversationshistorik och ta hänsyn till det största sammanhanget bland konkurrenterna. Antalet tillgängliga tokens kommer att fördubblas under sommaren. Gemini 1.5 Flash - Snabbt AI API för resultat i nära realtid.
AI för inlärning kommer att systematisera och förklara inlärningsmaterial, inklusive vardagliga exempel.
Circle to search - chipet som tillkännagavs i Galaxy S24 Ultra, som sedan tog sig till Google Pixel, kommer snart att visas på alla Android-smartphones. Som en påminnelse räcker det med att ringa in ett objekt på skärmen för att Google ska avgöra exakt vad som avbildas där och starta en sökning efter det objektet.
Djupgående kontextanalys. Om du till exempel ber Gemini att organisera en resa kommer den inte bara att köpa en biljett, utan också föreslå en plats att bo på och kontrollera väderprognosen. Eller när du beställer skor kommer den att kunna justera din storlek från din Gmail-korrespondens.
Gemini kan tillfrågas inte bara via text eller röst, utan också via kamera. I demonstrationsvideon förklarade Gemini vad objektet i bilden gjorde, analyserar programkod i farten och förklarar vad den gör, löser pussel, minns var objektet som sågs i bilden tidigare var.
Gemini-eran för sökning. Sökningen kommer inte bara att omedelbart producera AI-genererade utdrag och svar, sökningen kommer nu att kunna göra upp planer och uppgifter. Du kommer att kunna ange komplexa frågor, och sedan kommer Gemini att planera en rutt, kontrollera en anläggnings betyg eller skapa en meny för veckan om det behövs, omedelbart göra en lista över inköp och platser att göra dem.
Gmail kommer nu att tillhandahålla en sammanställning av e-postmeddelanden, och det kommer att vara möjligt att kombinera flera e-postmeddelanden och göra en sammanställning av e-postmeddelanden tillsammans. AI kommer också att kunna svara på alla avsändare av dessa e-postmeddelanden, lägga till uppgifter i din kalender eller till och med skapa en Google Sheets-tabell över alla liknande erbjudanden som har kommit i posten.
När det gäller teamarbete kommer Gemini att analysera alla dina chattar på jobbet, söka och analysera information i dem och svara rätt kollegor även om du inte vet i vilken chatt rätt diskussion äger rum.
Gemini kan skicka en PDF-fil på upp till 1500 sidor för analys och be om en kort översättning. Eller en video på upp till 1 timme, och Gemini analyserar alla fragment och visar vid behov exakt det segment som användaren behöver.
Gemini kan tillfrågas om varför en viss mekanism inte fungerar, t.ex. en DJ-konsol eller en kamera, och AI:n ger ett svar på hur den ska åtgärdas. För att göra detta känner AI:t igen mekanismen i ramen, dess modell, den åtgärd som användaren försöker göra, använder dessa data för att göra en sökning, analyserar den och extraherar exakt den information som behövs.
AI för programmerare genererar kod enligt beskrivningen av uppgiften, skapar en databas med foton av föremål och söker efter fel.
Skydd mot bedrägliga samtal. AI analyserar era samtal i realtid och om samtalspartnern beter sig misstänkt, t.ex. frågar efter bankuppgifter, avges en ljudsignal och en varning om eventuellt bedrägeri.
Den artificiella intelligensen kommer att stödja 35 språk och kommer att ha det största kontextuella fönstret av alla konkurrenter.

I år svarade Sundar Pichai på humorn kring förra årets Google I/O-presentation och presenterade omedelbart statistik som visade att akronymen "AI" yttrades 120 gånger under den nästan två timmar långa presentationen. Och sedan en gång till.

Källa: Google I/O Google I/O

Google I/O Tillkännagivanden