- Výzkumný tým v Applu zkoumal možnosti využití AI v App Store
- Při srovnání tradičního vyhledávání s tím obohaceným o AI došel k zajímavým výsledkům
- Pokud by Apple AI do svého obchodu nasadil, vývojáři by jistě měli radost
Apple je, co se týče aplikace umělé inteligence, značně pozadu oproti konkurenci. Ponechme stranou debaty o tom, zda konkurenti našli relevantní využití pro AI, nebo ji jen používají jako marketingovou vábničku – akcionáři a investoři zkrátka chtějí vidět písmena AI všude, kde se dá. V některých oblastech má ale experimentování s umělou inteligencí smysl a Apple si toho je vědom. Jeho výzkumníci provedli A/B testování, aby změřili, jak by štítky relevance generované umělou inteligencí ovlivnily hodnocení vyhledávání v App Store a stahování aplikací.
AI může pomoci vývojářům dostat aplikace k uživatelům
V nové studii s názvem Zvýšení relevance vyhledávání: vylepšení hodnocení v App Store pomocí hodnocení generovaných LLM skupina výzkumníků Applu zkoumala, zda by LLM mohly pomoci zlepšit výsledky vyhledávání v App Store generováním štítků relevance používaných k trénování systému hodnocení. Jak studie vysvětluje, relevance je klíčová pro to, aby uživatelé mohli najít aplikace, které hledají.
Ačkoli existuje mnoho signálů, které mohou přispět k hodnocení vyhledávání, výzkumníci se zaměřili na dva hlavní. Konkrétně jde o behaviorální relevanci, která odráží způsob, jakým uživatelé interagují s výsledky, tedy zda například klepnou na aplikaci, nebo ji stáhnou, a textovou relevanci, která měří, jak dobře metadata aplikace sémanticky odpovídají vyhledávacímu dotazu uživatele.

„Zatímco štítky behaviorální relevance jsou hojné, textové štítky relevance generované lidskými hodnotiteli jsou mnohem vzácnější. To vytváří zásadní problém: vysoce kvalitní textové štítky relevance jsou vzácné a jejich výroba je nákladná, což vytváří překážku škálovatelnosti a způsobuje, že cíl textové relevance je v rámci víceúčelového tréninku nedostatečně podporován,“ uvádí Apple.
Uživatelé na výsledky obohacené o AI reagovali lépe
Aby tento problém vyřešili, pracovníci vyladili LLM s 3 miliardami parametrů na základě existujících lidských úsudků, aby se mohl naučit přiřazovat aplikacím relevantní štítky na základě vyhledávacího dotazu uživatele a metadat aplikace. Poté pomocí tohoto modelu vygenerovali miliony nových štítků relevance a přecvičili systém hodnocení App Store pomocí původních dat i štítků vygenerovaných velkým jazykovým modelem.
Jinými slovy uživatelé, kteří viděli výsledky vyhledávání seřazené pomocí modelu rozšířeného o LLM, stáhli alespoň jednu aplikaci o 0,24 % častěji než uživatelé, kteří viděli výsledky vyhledávání prezentované tradičním způsobem. Ačkoli je 0,24 % samozřejmě velmi malé zvýšení, při zohlednění toho, že většina odhadů předpokládá celkový počet stažení z App Store v roce 2025 kolem 38 miliard, se může jednat o výrazný nárůst. V praxi by to mohlo znamenat desítky milionů dalších stažení z vyhledávání v App Store, což by vývojáři jistě ocenili.
