Seo

Was unsere AI -Modus -Benutzerverhaltensstudie über die Zukunft der Suche enthüllt

Unsere neue Usability -Studie von 37 Teilnehmern in sieben spezifischen Suchaufgaben zeigt deutlich, dass Menschen:

  1. Lesen Sie den AI -Modus
  2. Selten herausklicken, und
  3. Gehen Sie nur, wenn sie bereit sind zu tätigen.

Nach dem, was wir wissen, gibt es keine andere unabhängige Usability -Studie, die den KI -Modus in dieser Tiefe untersucht hat.

Im Mai veröffentlichte ich eine umfangreiche zweiteilige Studie über KI-Übersichten (AIOS) mit Amanda, Eric Van Buskirk und seinem Team. Eric und ich haben auch an der Propellics Travel Industry KI -Modusstudie zusammengearbeitet.

Wir haben erneut zusammengearbeitet, um Ihnen das Wachstumsmemo dieser Woche zu bringen: eine Studie, die wichtige Einblicke und Validierung in das Verhalten von Menschen bietet, wenn sie mit dem KI -Modus von Google interagieren.

Da weder Google noch OpenAI (oder jemand anderes) Benutzerdaten für ihre KI -Produkte (Search) bereitstellen, schließen wir eine entscheidende Lücke.

Wir haben Bildschirmaufnahmen und Denkveranstaltungen über eine Fernstudie aufgenommen. Die 250 eingenommenen Aufgaben bieten einen robusten Datensatz für unsere Analyse. (Die vollständige Methodik erfolgt am Ende dieses Memos, einschließlich Details zu den sieben Suchaufgaben.)

Und Sie könnten von einigen Erkenntnissen überrascht sein. Wir waren.

Dies ist ein längerer Beitrag, also holen Sie sich einen Drink und lassen Sie sich ein.

Bildnachweis: Kevin Indig

Zusammenfassung

Unsere neue Usability -Studie über den KI -Modus von Google zeigt, wie tief diese Funktion das Benutzerverhalten ändert.

  • Der AI -Modus hält Aufmerksamkeit und hält Benutzer im Inneren. In ungefähr drei Vierteln der gesamten Benutzersitzungen verließen Benutzer nie den KI -Modus -Bereich – und 88 % der ersten Interaktionen der Benutzer waren mit dem KI -generierten Text. Das Engagement war hoch: Die mittlere Zeit nach Aufgabentyp betrug ungefähr 52-77 Sekunden.
  • Klicks sind selten und meist transaktional. Die mediane Anzahl externer Klicks pro Aufgabe war Null. Ja. Sie lesen das richtig. Null. Und 77,6% der Sitzungen hatten keine externen Besuche.
  • Die Leute überfliegen, treffen aber immer noch Entscheidungen im KI -Modus. Über die Hälfte der Aufgaben wurde als „schnell überfrohen“ eingestuft, wo die Benutzer auf die Zusammenfassung der KI schauen, eine Meinung bilden und weitermachen.
  • Der AI -Modus liefert „Site -Typen“, die die Absicht entsprechen. Es geht nicht nur darum, Suchanfragen oder schnelle Absichten zu erfüllen. Der KI -Modus zitiert Quellen, die bestimmte Standortkategorien entsprechen (wie Marktplätze im Vergleich zu Überprüfungsseiten gegenüber Marken).
  • Sichtbarkeit, nicht Verkehr, ist die aufstrebende Währung. Die Teilnehmer machten ihre Markenurteile direkt aus den Ausgängen des KI -Modus.

Tl; dr? Dies sind die Kernergebnisse aus dieser Studie:

  • Der KI -Modus ist klebrig.
  • Klicks sind für Transaktionen reserviert.
  • Der AI -Modus entspricht dem Standorttyp mit Absicht.
  • Produktvoranschauungen wirken wie Mini -Produktdetailseiten (auch bekannt als PDPs).

Anerkennung

Aber bevor wir uns eingraben, ist hier ein kurzes Schuss zu dem Team hinter dieser Studie.

Zusammen mit dem Team von Eric Van Buskirk bei ClickStream Solutions habe ich die erste Studie zur umfassenden Usability über den KI -Modus von Google durchgeführt, der nicht nur entscheidende Einblicke in die Interaktion mit der Hybrid -Suche/KI -Chat -Engine aufdeckt, sondern auch welche Arten von Marken -Sites AI -Modus -Oberflächen und wann.

Ich möchte hervorheben, dass Eric Van Buskirk der Forschungsdirektor war. Während wir eng an der Gestaltung der Forschungsfragen, der Fokusbereiche und der Methodik zusammengearbeitet haben, leitete Eric das Team, beaufsichtigte die Studienausführung und lieferte die Ergebnisse. Danach arbeiteten wir nebeneinander, um die Daten zu interpretieren.

Click Data ist ein großartiger erster Pass für die Analyse über das, was im KI-Modus passiert, aber mit dieser Usability-Studie schauten wir im Wesentlichen „über der Schulter“ von realen Benutzern an, als sie Aufgaben erledigten, was zu einer robusten Sammlung von Daten führte, von denen Einblicke angerufen wurden.

Unsere Testplattform war uxtWeak.

Steigern Sie Ihre Fähigkeiten mit den wöchentlichen Experten -Erkenntnissen von Wachstum Memo. Kostenlos abonnieren!

Ignorieren Sie diese AI -Modusdaten auf eigenes Risiko

Der eigene Sundar Pichai von Google war kristallklar: Der KI -Modus ist kein Spielzeug. Es ist ein nachweisender Grund dafür, wie das Kernsucheerlebnis in Zukunft aussehen wird.

Im Lex Fridman -Podcast sagte Pichai (Bolding Mine):

„Unser aktueller Plan ist der KI -Modus wird als separater Registerkarte für Menschen da sein, die das wirklich erleben möchten… aber als Funktionen funktionieren. Wir werden es weiter auf die Hauptseite migrieren…” [1]

Google hat argumentiert, dass diese neuen AI-fokussierten Funktionen die Benutzer auf das Web verweisen sollen. In der Praxis zeigen jedoch unsere Daten, dass Benutzer bei der Herstellung bleiben und Entscheidungen treffen, ohne zu klicken. Theoretisch könnte dies nicht nur die Klick-Outs auf organische Ergebnisse und Zitate beeinflussen, sondern auch externe Klicks auf Anzeigen reduzieren.

Im August habe ich die Realität hinter Googles eigenem Produkt Kannibalisierung mit KI -Modus und AIOS untersucht:

Nach Angaben von ähnlichenWeb -Daten ist die Verwendung der Registerkarte “AI -Modus auf Google.com in den USA” leicht gesunken und liegt jetzt bei etwas mehr als 1%.

Google AIOIOs werden jetzt jeden Monat von mehr als 1,5 Milliarden Suchern gesehen und sitzen vorne und im Zentrum. Aber Engagement fällt. Benutzer verbringen weniger Zeit für Google und klicken auf weniger Seiten.

Da Google jedoch den AI -Modus weiterhin breit ausgeht, bringt es die größte Verschiebung zur Suche (dem größten Kundenakquisitionskanal, den es gibt) aller Zeiten.

Traditionelle SEO ist in der neuen KI -Welt sehr effektivAber wenn der KI -Modus wirklich zur Standardeinstellung wird, müssen wir unser Arsenal an Taktik überdenken.

Vorbereitung auf die Zukunft der Suche bedeutet, den KI -Modus als Ziel (nicht die Tür) zu behandeln und herauszufinden, wie man dort auf eine Weise auftaucht, die tatsächlich für das echte Benutzerverhalten von Bedeutung ist.

Mit dieser Studie habe ich versucht, tatsächliche Benutzerverhalten im AI -Modus zu entdecken und zu validieren, wenn eine Vielzahl von Aufgaben mit unterschiedlichen Suchabsichten ausgeführt werden.

1. AI -Modus ist klebrig

Bildnachweis: Kevin Indig

Schlüsselstatistiken

Die Leute lesen zuerst und bleiben normalerweise im KI -Moduserlebnis. Folgendes fanden wir:

  • Die Mehrheit der Sitzungen hatte keine externen Besuche: Das heißt, sie haben den KI -Modus (überhaupt) nicht verlassen.
  • ~ 88% der ersten Interaktion der Benutzer* innerhalb der Funktion war mit dem AI -Modus -Text.
  • Das typische Benutzereinsatz im KI -Modus beträgt ungefähr 50 bis 80 Sekunden pro Aufgabe.

Diese drei Statistiken definieren die Suchoberfläche des KI -Modus: Es hält Aufmerksamkeit und löst viele Aufgaben auf ohne Verkehr senden.

*Hier ist, was ich mit “Interaktion” meine: “Interaktion”

  • Eine „Interaktion“ innerhalb der Benutzeraufgaben = Der Teilnehmer hat nach dem Laden sinnvoll mit dem KI -Modus beschäftigt.
  • Was als Interaktion zählt: Lesen oder Scrollen des KI -Moduskörpers für mehr als einen kurzen Blick, einschließlich Scannen eines Ergebnisblocks wie dem Einkaufspaket oder des rechten Bereichs, Öffnen einer Händlerkarte, Klicken auf einen Inline -Link, Link -Symbol oder Bildpaket.
  • Was nicht als Interaktion gilt: kurze Augenfilme, Cursorübergänge oder Zögern, bevor sie sich engagieren.

Benutzer sind im KI -Modus zum Lesen – nicht unbedingt zum Durchsuchen oder Suchen -, wobei ~ 88% der Sitzungen zuerst mit dem Ausgangstext interagieren und eine Minute oder mehr innerhalb des KI -Moduserlebnisses verbringen.

Außerdem ist es interessant zu sehen, dass Benutzer im AI -Modus mehr als doppelt so viel Zeit im KI -Modus verbringen.

Das allgemeine Engagement ist viel stärker.

Bildnachweis: Kevin Indig

Warum ist es wichtig

Behandeln Sie das KI -Modus -Panel wie die primäre Leseoberfläche, nicht einen Teaser für blaue Links.

Der AI -Modus ist eine enthaltene Erfahrung, bei der das Senden von Klicks auf Websites eine niedrige Priorität hat und Benutzern die beste Antwort ist, die höchste.

Infolgedessen verändert es die Wertschöpfungskette für Inhaltsersteller, Unternehmen und Verlage vollständig.

Einblick

Warum sagen andere Quellen und/oder AI -Modus -Research -Analysen, dass Benutzer nicht sehr oft zur AI -Modusfunktion zurückkehren?

Meine Theorie hier ist, dass der KI -Modus eine separate Sucherfahrung (zumindest vorerst) nicht so sichtbar ist wie AIOS.

Mit zunehmender Akzeptanz von KI -Modus, wobei Google Gemini (und KI -Modus) in den Browser bringt, erwarte ich, dass unsere Studienergebnisse skaliert werden.

2. Klicks sind für Transaktionen reserviert

Während Klicks knapp sind, ist der Kaufabsichten nicht.

Die Teilnehmer an der Studie haben sich nur anklicken, wenn die Aufgabe sie verlangte (z. B. „einen Artikel in Ihren Warenkorb einfügen“) oder wenn sie ein wenig herum durchsucht haben.

Die Browserklicks waren jedoch so wenige, dass wir sicher annehmen können, dass der KI-Modus nur zu Klicks führt, wenn Benutzer kaufen möchten.

Sogar Eingabeaufforderungen mit einem Vergleich und einer Informationsabsichten, die Benutzer in der Funktion halten.

  • Einkäufe Eingabeaufforderungen mögen [canvas bag] Und [tidy desk cables] Starten Sie den höchsten AI -Modus -Ausgangsanteil.
  • Vergleichsaufforderungen wie [Oura vs Apple Watch] Zeigen Sie den niedrigsten Ausstiegsanteil der Aufgaben.

Wenn die Teilnehmer ermutigt wurden, Maßnahmen zu ergreifen („Einen Artikel in Ihren Einkaufswagen einfügen“ oder „ein Produkt finden“), gingen die meisten Klicks zu Einkaufsfunktionen wie Einkaufspaketen oder Handelskarten.

Bildnachweis: Kevin Indig

18% der Ausgänge wurden von Benutzern verursacht, die den KI -Modus beenden und direkt zu einem anderen Standort gingen, um es viel schwieriger zu machen, den Ingenieur zu entgegenzunehmen, was diese Besuche überhaupt antrieb.

Studientranskripte bestätigen, dass die Teilnehmer häufig laut teilen, dass sie „zur Seite des Verkäufers gehen“ oder „das Produkt bei Amazon/eBay für Produktsuche finden“.

Selbst beim Vergleich von Produkten, ob Software oder physische Waren, klicken Benutzer kaum aus.

Bildnachweis: Kevin Indig

In einfacher Hinsicht frisst der AI -Modus alle Tofu- und MoFU -Klicks auf. Benutzer entdecken Produkte und bilden Meinungen über sie im KI -Modus.

Schlüsselstatistiken

  • Von 250 gültigen Aufgaben war die mittlere Anzahl externer Klicks Null!
  • Die schnelle Aufgabe von [canvas bag] hatte 44 externe Klicks und [tidy desk cables] hatte 31 Klicks, die zwei Drittel aller externen Klicks in dieser Studie berücksichtigen.
  • Vergleichsaufgaben mögen [Oura Ring vs Apple Watch] oder [Ramp vs Brex] hatte nur sehr wenige Klicks (≤ 6 Gesamtsumme über alle Aufgaben).

Warum ist es wichtig

Hier ist, was interessant ist …

In der AIOIOS -Übersichts -Usability -Studie haben wir festgestellt, dass Desktop -Benutzer ~ 10,6% der Fälle im AI -Modus praktisch 0% klicken.

AIOS haben jedoch organische Suchergebnisse und SERP -Funktionen darunter. (Die Leute klicken weniger in AIOS, aber sie klicken häufiger auf organische Ergebnisse und SERP -Funktionen.)

Zero-Klicks

  • KI -Übersichten: 93%*
  • AI -Modus: ~ 100%

*Denken Sie daran, dass die Teilnehmer der AIO -Usability -Studie auf regelmäßige organische Suchergebnisse geklickt haben. Die 93% beziehen sich auf Null -Klicks innerhalb der KI -Übersicht.

Auf dem Desktop erzeugt der AI-Modus im Vergleich zum AIO-Panel ungefähr doppelt so hoch wie die In-Panel-Klickouts. Bei AIO-SERPs können die gesamten Klickouts weiterhin über organische Ergebnisse unterhalb des Panels erfolgen, sodass die Rate auf Seitenebene zwischen der AIO-Panel-Figur und der klassischen Basislinie liegt.

Ein wichtiger Hinweis hier von Eric Van Kirk, dem Direktor dieser Studie: Beim Vergleich des KI -Modus- und KI -Überblickstudiums vergleichen wir nicht genau die Äpfel mit Äpfeln. In dieser Studie erhielten die Teilnehmer Aufgaben, die sie dazu veranlassten, den KI -Modus in 2/7 Fragen zu verlassen, und die die Mehrheit der ausgehenden Klicks (die weniger als drei externe Klicks waren). Andererseits lautete für die AIO -Studie die am meisten Transaktionsfrage „ein tragbares Ladegerät für Telefone unter 15 US -Dollar gefunden. Suchen Sie nach normalerweise.“ Sie wurden nicht gesagt, sie sollten es in einen Einkaufswagen stecken. Die Erkenntnisse in das Benutzerverhalten aus dieser AI -Modusstudie – und das Muster, das Benutzer nicht im AI -Modus herausklicken müssen, um zusätzliche Entscheidungen zu treffen – ist immer noch ein solider Befund.

Einblick

Das größere Bild hier ist, dass AIOS wie ein Faktenblatt sind, das die Benutzer irgendwann auf Websites leitet, aber der KI -Modus ist eine geschlossene Erfahrung, bei der Benutzer selten überklicken.

Was den KI -Modus (und Chatgpt übrigens) schwierig macht, ist, wenn Benutzer die Erfahrung aufgeben und direkt auf Websites gehen. Es macht Attributionsmodelle und unsere Fähigkeit zu verstehen, was Conversions beeinflusst.

3. AI -Modus entspricht dem Site -Typ mit Absicht

In der Studie beurteilen wir Welche Arten von Websites KI -Modus zeigt für unsere sieben Aufgaben.

Die Typen sind:

  • Marken: Verkäufer/Verkäufer.
  • Marktplätze: Amazon.com, eBay.com, Walmart.com, Homedepot.com, Bestbuy.com, Target.com, Rei.com.
  • Überprüfungsseiten: nerdwallet.com, pcmag.com, zdnet.com, nymag.com, usatoday.com, businessInsider.com.
  • Verlag: Nytimes.com, NBCNews.com, youtube.com, thesprce.com.
  • Plattform: Google.
Bildnachweis: Kevin Indig

Schlüsselstatistiken

Einkaufsfordern Route zu Produktseiten:

  • Leinwandtasche: 93% der Ausgänge gehen an den Market Marketplace.
  • Tidy -Schreibtischkabel: 68% gehen zu Brand Marketplace, mit einem sichtbaren Verlagsschnitt.

Vergleichsroute zu Bewertungen:

  • Ramp gegen Brex: 83% Review.
  • Oura gegen Apple Watch: Trennende Marke 50% und 50% Marktplatz.

Wenn der Benutzer eine Reputationsprüfung durchführen muss, ist das Ergebnis Split -Marke und Verlage:

  • Liquid Death: 56 % Marke, 44 % Verlag.

Google selbst zeigt sich bei Einkaufsaufgaben:

  • Store -Lookups an Business.google.com werden in Canvas -Taschen (7%) und ordentlichen Schreibtischkabeln (11%) angezeigt.

Schauen Sie sich die erstklassigen Domains nach Aufgabe an:

  • Leinwandtasche: llbean.com, eBay.com, rticoutdoors.com, business.google.com.
  • Tidy Schreibtischkabel: Walmart.com, Amazon.com, homedepot.com.
  • Abonnement -Sprach -Apps gegen kostenlos: pcmag.com, nytimes.com, usatoday.com.
  • Wasser in Flaschen (flüssiger Tod): reddit.com, liquedeath.com, youtube.com.
  • Ramp gegen Brex: nerdwallet.com, kruzeconsulting.com, Airwallex.com.
  • Oura Ring 3 gegen Apple Watch 9: Ouraring.com, Zdnet.com.
  • VR Arcade oder Smart Home: sandboxvr.com, Business.google.com, yodobashi.com.

Warum ist es wichtig

Unternehmen müssen die Wettbewerbsbedingungen verstehen. Während klassische SEO es im Grunde genommen zugelassen hat, dass jede Site für jede Benutzerabsicht sichtbar ist, hat der AI -Modus strenge Regeln:

  • Marken schlagen Marktplätze, wenn Benutzer wissen, welches Produkt sie wollen.
  • Marktplätze werden bevorzugt, wenn die Optionen breit oder allgemein sind.
  • Überprüfungsseiten erscheinen für Vergleiche.
  • Meinungen heben Reddit und Verlage hervor.
  • Google selbst ist für lokale Absichten und manchmal einkaufen.

Einblick

Als SEOS müssen wir berücksichtigen, wie Google unsere Website basierend auf den Seitenvorlagen, dem Ruf und dem Benutzerbetrieb klassifiziert. Vor allem müssen wir jedoch die Eingabeaufforderungen im KI -Modus überwachen und den Site -Mix betrachten, um sie zu verstehen Wo Wir können spielen.

Websites können und werden für alle Arten von Abfragen in einem Thema nicht mehr sichtbar sein. Sie müssen Ihre Strategie nach der Absicht filtern, die mit Ihrem Site -Typ übereinstimmt, da der AI -Modus nur bestimmte Websites (wie Überprüfungsseiten oder Marken) für bestimmte Arten von Absichten anzeigt.

4. Produktvoranschauungen wirken wie Mini -PDPs

Schlüsselstatistiken

Produktvoransichten werden in etwa 25% der AI -Modussitzungen angezeigt, ~ 9 Sekunden Aufmerksamkeit erhalten und die Menschen öffnen normalerweise nur einen.

Dann? 45% stoppen hier. Viele Öffnungen sind schnelle Speetz -Schecks, kein Clickout.

Bildnachweis: Kevin Indig

Sie können leicht sehen, wie einige Produktempfehlungen im AI-Modus und im Vor-Ort-Erlebnis für Benutzer ziemlich frustrierend sind.

Das Post-Click-Erlebnis ist entscheidend: Klassische Best Practices wie Bewertungen haben einen großen Einfluss darauf, das Beste aus den wenigen Klicks herauszuholen, die wir noch erhalten.

Siehe dieses Beispiel:

“Es sieht so aus, als hätte es viele positive Bewertungen. Das ist eine Sache, die ich mir ansehen würde, wenn ich diese Tasche kaufen würde. Das wäre also die, die ich wählen würde.”

Warum ist es wichtig

Bei Einkaufsaufgaben stellten wir fest, dass Markenseiten den größten Teil der Ausgänge benötigen.

Bei Vergleichsaufgaben haben wir festgestellt, dass Überprüfungsstandorte dominieren. Für Reputationsprüfungen (wie eine Eingabeaufforderung für [Liquid Death]), Ausgänge an Marken und Verlage wurden geteilt.

  • Für Transaktionsabsichten Eingabeaufforderungen: Marken absorbieren die meisten Ausgänge, wenn es die Aufgabe ist, jetzt einen Artikel zu kaufen. [Canvas Bag] zeigt eine starke Neigung zu Markenpdps.
  • Für die Aufforderung zur Absicht der Reputation: Markenseiten erscheinen neben Publishers. Eine Aufforderung für [Liquid Death] Spalt zwischen Liquiddeath.com und Reddit/YouTube/Eater.
  • Für Vergleichsaufforderungen: Marken treten in den Hintergrund. [Ramp vs Brex] Ausgänge gehen hauptsächlich an, um Websites wie Nerdwallet und Kruze zu überprüfen.

Einblick

Da Benutzer jetzt direkt im ChatGPT- und KI-Modus auschecken können, senden die Einkaufsaufgaben möglicherweise noch weniger Klicks.[2,3]

Daher wird der KI -Modus zu einem völlig geschlossenen Erlebnis, bei dem auch die selbsteinkäufe Absicht in der App erfüllt ist.

Die Geschichte des KI -Modus ist noch nicht fertig: Wohin von hier aus gehen soll

Klicks sind knapp. Einfluss ist reichlich vorhanden.

Die Daten geben uns einen Reality -Check: Wenn Benutzer weiterhin die neue Art des Googelns übernehmen, wird der KI -Modus das Suchverhalten so umformen, wie es sich SEOS nicht leisten kann, es zu ignorieren.

  • Die Strategie verschiebt sich von “Get the Click”, um das Zitat zu verdienen.
  • Vergleiche sind für Vertrauen, nicht für den Verkehr. Sie reduzieren die Ausgänge, weil Benutzer sich im Panel informiert fühlen.
  • Händler sollten für entscheidende Ausgänge optimieren. Geben Sie die Preise, die Verfügbarkeit und den Nachweis über der Falte an, um die wenigen Ausgänge zu konvertieren, die Sie erhalten.

Sie müssen Zitate verdienen, die die Aufgabe beantworten und dann die wenigen verbleibenden hochwertigen Ausgänge gewinnen.

Aber unsere Studie endet hier nicht.

Die heutigen Ergebnisse zeigen Kerneinsichten in Wie Menschen interagieren mit dem KI -Modus. Wir werden mehr zu berücksichtigen, wenn Teil 2 nächste Woche fällt.

Aber für diejenigen, die es lieben, sich mit Details zu befassen, ist die Methodik der Studie unten enthalten.

Methodik

Studiendesign und Ziel

Wir haben eine Usability-Studie mit gemischten Methoden durchgeführt, um zu quantifizieren, wie der neue AI-Modus von Google das Sucherverhalten ändert. Jeder Teilnehmer absolvierte sieben Live -Google -Suchanforderungen über die AI -Modusfunktion. Dieses Design ermöglicht es uns, sowohl die Mechanik der Interaktion (Scrollen, Klicks, Verweil, Vertrauen) als auch die qualitativen Argumentationsteilnehmer zu beobachten, die während der Erledigung von Aufgaben geäußert wurden.

Die Aufgaben:

  1. Was sagen die Leute über flüssigen Tod, das Getränkebereich? Ehren dich ihre Getränke an?
  2. Stellen Sie sich vor, Sie werden einen Sleep Tracker kaufen und die einzigen zwei verfügbar sind der Oura Ring 3 oder die Apple Watch 9. Welche würden Sie wählen und warum?
  3. Sie erhalten Einblicke in die Vorteile einer Ramp -Kreditkarte im Vergleich zu einer Brex -Karte für kleine Unternehmen. Welches scheint besser zu sein? Was würde einen Geschäftswechsel von einer anderen Karte wechseln: Gebührendetail, Zulassungsmark oder Belohnungen?
  4. Geben Sie im KI -Modus in der Box “Anything Anything” ein, “Helfen Sie mir, einen wasserdichten Leinwandbeutel zu kaufen.” Wählen Sie eine aus, die Ihren Anforderungen am besten entspricht, und Sie würden kaufen (z. B. eine Kameratasche, Einkaufstasche, Duffel -Beutel usw.).
    • Gehen Sie zur Seite des Verkäufers. Klicken Sie hier, um den Einkaufswagen hinzuzufügen und diese Aufgabe zu erledigen, ohne weiter zu gehen.
  5. Vergleichen Sie Abonnement -Sprach -Apps mit kostenlosen Sprach -Apps. Würden Sie bezahlen und in welcher Situation? Welches Produkt würden Sie wählen?
  6. Nehmen wir an, Sie besuchen einen Freund in einer großen Stadt und möchten entweder: 1. Eine Arcade in der virtuellen Realität oder 2. Ein intelligenter Home -Showroom. Wie heißt die Stadt, die Sie besuchen?
  7. 1. Angenommen, Sie arbeiten an einem kleinen Schreibtisch und Ihre Kabel sind ein Chaos. 2. Geben Sie im KI -Modus in der KI -Box „Anversuche“ ein: „Die Gerätekabel überladen meinen Schreibtischraum. Was kann ich heute kaufen, um zu helfen?“ 3. Wählen Sie dann das eine Produkt aus, von dem Sie glauben, dass es die beste Lösung ist. Setzen Sie es in den Einkaufswagen auf der externen Website und beenden Sie diese Aufgabe.

Teilnehmer und Rekrutierung

Siebenunddreißig englischsprachige US-Erwachsene wurden zwischen dem 20. August und dem 1. September 2025 über produktiv rekrutiert (einschließlich Teilnehmer einer kleinen Gruppe, die Pilotstudien durchgeführt haben).*

Die Berechtigung erforderte eine produktive Zulassungsrate von ≥ 95%, ein Browser auf Chrombasis und ein funktionierendes Mikrofon. Die Teilnehmer besuchten den KI -Modus und erledigten Aufgaben über ihren Desktop -Computer aus der Ferne. Ungültige Sitzungen wurden wegen technischer Fehler oder Nichteinhaltung ausgeschlossen. Der endgültige Datensatz enthält über 250 gültige Aufgabenaufzeichnungen in 37 Teilnehmern.

*Pilotstudien werden zuerst in Fern Usability-Tests durchgeführt, um technische Probleme wie Screen-Sharing, Task-Setup oder Aufzeichnungsprobleme zu identifizieren und zu beheben, bevor die Hauptstudie beginnt. Sie helfen dabei, Aufgabenverformungen, Timing und Anweisungen zu verfeinern, um sicherzustellen, dass die Teilnehmer sie richtig interpretieren. Am wichtigsten ist, dass Pilotsitzungen bestätigen, dass die gesammelten Daten tatsächlich die Forschungsfragen beantworten und dass die Methodik in einer realen Fernbedienung reibungslos funktioniert.

Aufgabenprotokoll

Die Sitzungen wurden im fernreinigierten Modus von UxtWeak ausgeführt. Die Teilnehmer las eine Aufgabe -Eingabeaufforderung, klickten auf Google.com/aimode, forderten den KI -Modus und sprachen ihre Gedanken laut, während sie mit dem KI -Modus interagierte. Sie erhielten die folgenden Anweisungen: „Denken Sie laut und erklären Sie kurz, was Ihre Aufmerksamkeit auf sich zieht, wenn Sie die Informationen überprüfen. Sprechen Sie laut und bewegen Sie Ihre Maus, um anzugeben, wo Sie die gesuchten Informationen finden.“ Jeder Teilnehmer absolvierte sieben Task -Typen, die für die Abdeckung verschiedener Intent -Kategorien entwickelt wurden, einschließlich Vergleichs-, Transaktions- und Informationsszenarien.

Stapel erfassen

UxtWeak hat Vollbildvideo, Cursorpfade, Scrollereignisse und Audio aufgenommen. Die Sitzungen betrugen durchschnittlich 20 bis 25 Minuten. Anreize waren wettbewerbsfähig. RAW -Aufzeichnungen, Transkripte und Ereignisprotokolle wurden zur Codierung und Analyse exportiert.

Annotationsverfahren

Drei geschulte Codierer überprüften jedes Video parallel. Eine Reihe wurde für UI -Elemente protokolliert, die ~ 5 Sekunden oder länger aufmerksam waren. Gefangene Variablen enthalten:

  • Strukturell: Felder, die das Setup, die Metadaten oder die Struktur der Studie beschreiben – nicht das Benutzerverhalten; Fügen Sie Daten wie Teilnehmer-ID, Aufgabe, Gerät, Abfrage, Reihenfolge der UI-Elemente hinzu, die während der Aufgabe, Art der Site-Klick (z. B. soziale, Community, Marke, Plattform), Domainnamen der externen Website und mehr geklickt oder besucht wurden.
  • Besonderheit: Felder, die UI -Elemente oder Schnittstellenkomponenten beschreiben, die dem Teilnehmer erschienen oder zur Verfügung standen. Beispiele hierfür sind UI -Elementtyp, einschließlich Einkaufskarussells, Handelskarten, rechter Tafel, Link -Symbole, Karteneinbettung, lokaler Packung, GMB -Karte, Handelspakete und Handelskarten.
  • Engagement: Felder, die aktive Benutzerinteraktion, Aufmerksamkeit oder Zeitinvestition erfassen. Enthält Lesen und Aufmerksamkeit, Chat und Fragenverhalten sowie Klick- und Interaktionsverhalten.
  • Ergebnis: Felder, die Benutzerergebnisse, Annotator -Bewertungen oder Interpretation des Verhaltens darstellen. Annotator -Kommentare, Aufwandsbewertung, bei denen Informationen gefunden wurden.

Codierer markierten auch qualitative Themen (z. B. „Geschwindigkeit“, „Skepsis“, „Vertrauen in Zitate“), um das Abrufen auf Lappenbasis zu unterstützen. Der Forschungsdirektor überprüfte ~ 10% der Videos, um die Konsistenz zu validieren.

Datenverarbeitung und Metriken

Anmerkungen wurden nach Python/Pandas 2.2 exportiert. Platzhaltercodes (‘999 = nicht zutreffend’, ‘998 = nicht beobachtbar’) wurden entfernt und kategoriale Variablen (z. B. Erscheinungen, Klicks, Stimmung) normalisiert. Verweilzeiten und andere Zeitmetriken wurden für extreme Ausreißer beschnitten. Nach der Reinigung blieben ~ 250 gültige Zeilen auf Aufgabenebene.

Unsere Pipeline (Abruf-Augmented Generationed Generation) ermöglichte drei Analysestufen:

  • Datenbereitschaft (Einnahme): Wir haben die sieben Aufgaben jedes Teilnehmers in einzelne Reihen, gereinigte codierte Werte und standardisierte Zeit-, Klick- und andere Metriken abgeflacht. Transkripte wurden beibehalten, damit strukturierte Daten (z. B. Verweilzeit) mit dem verbunden sind, was Benutzer tatsächlich sagten. Ziel: Erstellen Sie einen sauberen, einheitlichen Datensatz, der das Verhalten mit Argumentation verbindet.
  • Relevanzfilterung (Abruf): Wir haben strukturierte Felder und Anmerkungen verwendet, um Muster zu isolieren, wie beispielsweise Benutzer, die den KI -Modus verlassen, auf eine Händlerkarte geklickt haben oder Zögern zeigten. Wir dann s Ohrten die Transkripte für Themen wie Vertrauen, Bequemlichkeit oder Frustration. Ziel: Kombinieren Sie Verhalten und Gefühl, um die echte Benutzerabsicht zu enthüllen.
  • Interpretation (Quant Qual Synthese): Für jede Gruppe haben wir deskriptive Statistiken (Verwalten, Klicks, Vertrauen) berechnet und sie mit Transkriptbeweisen gepaart. So tauchten wir Einblicke auf: „Aufgaben von externen Site zeigten eine höhere Zufriedenheit, aber mehr CTA-Verwirrung.“ Ziel: Link, was die Leute mit dem gemacht haben, was sie im KI -Modus fühlten.

Diese Pipeline ermöglichte es uns, den Datensatz hyperspezifisch abzufragen – z. B. „alle Teilnehmer, die> 50% im KI -Modus scrollierten, aber Misstrauen ausdrückten“ – und die quantitativen Ergebnisse mit qualitativem Denken verknüpfen.

In klarer Hinsicht: Wir können genau die richtige Gruppe von Teilnehmern oder Momenten hochziehen, wie „all die Menschen, die Aio nicht vertrauen“ oder „alle, die mehr als 50%scrollten“.

Statistische Analyse

Wir haben das Benutzerverhalten mithilfe deskriptiven und inferentiellen Statistiken über 250 gültige Aufgabenaufzeichnungen zusammengefasst. Jede Metrik umfasste die Anzahl, Mittelwert, Median, Standardabweichung, Standardfehler und 95% -Konfidenzintervall. Die kategorialen Ergebnisse, z. B. ob die Teilnehmer den KI -Modus verließen oder auf eine Händlerkarte klickten, wurden als Proportionen gemeldet.

Die Analysen deckten mehr als 50 strukturierte und Verhaltensfelder ab – von Gerätetyp- und Verweilzeit bis hin zu UI -Interaktionen, Stimmung. Vertrauensmaßnahmen wurden aus einer JSON -Analyse der Benutzerstimmung über Transkripte aller Benutzer abgeleitet.

Zuverlässigkeit und Macht

Jede Aufgabe wurde von einem ausgebildeten Kodierer kommentiert und nach Annotatoren überprüft. Verteilungen auf Codiererebene wurden mit der Bestätigung stabiler Kennzeichnungsmuster und der internen Konsistenz verglichen.

Siebenunddreißig Teilnehmer haben jeweils sieben Aufgaben ausgeführt, was zu ungefähr 250 gültigen Aufgaben führte. In dieser Skala tragen Proportionen rund 50% eine Fehlerquote von etwa sechs Prozentpunkten, was dem Datensatz genügend Genauigkeit ergibt, um aussagekräftige Richtungsunterschiede zu erkennen.

Einschränkungen

Die Stichprobengröße ist kleiner als unsere KI-Übersichtsstudie (37 gegenüber 69 Teilnehmern) und soll über US-amerikanische Benutzer lernen (alle Teilnehmer lebten in den USA). Alle Abfragen fanden im KI-Modus statt, was bedeutet, dass wir AI mit nicht-AI-Bedingungen nicht direkt verglichen haben. Denkweise kann die Verweilzeiten leicht aufblasen. Lappengetriebene Codierung ist nur so stark wie seine Annotationseingaben, obwohl starke Spot-Checks die Zuverlässigkeit bestätigten.

Ethische Einhaltung

Die Teilnehmer gaben eine Einverständniserklärung ab. Aufnahmen wurden verschlüsselt und anonymisiert; Es wurden keine persönlichen Identifizierungsdaten beibehalten. Die Studie entspricht der Ethikpolitik von Produktion und UxtWeak TOS.


Ausgewähltes Bild: Paulo Bobbita/Suchmaschinenjournal

Leave a Reply