PerplexityBot

Technické informace

User-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)
Respektuje robots.txt: ano
Publikované IP: Rozsahy IP
Oficiální dokumentace: Odkaz

Podrobný popis

PerplexityBot je hlavní indexační crawler společnosti Perplexity AI, která provozuje stejnojmenný konverzační vyhledávač. Funkčně je podobný Googlebotu nebo OAI-SearchBot — systematicky prochází web, buduje index a ten feeduje search funkcionalitu. Klíčová odlišnost Perplexity od konkurence je v tom, že každá odpověď obsahuje inline citace na konkrétní zdroje — nejde tedy jen o „AI shrnutí“, ale o strukturovanou odpověď s jasnou atribucí.

Pro majitele webu to má zásadní praktický důsledek: když vás PerplexityBot proindexuje a Perplexity vás zahrne do odpovědi, uživatel ve výsledku uvidí váš web jako citovaný zdroj a může na něj prokliknout. Perplexity explicitně uvádí, že PerplexityBot nepoužívá data pro trénink foundation modelů — Perplexity žádné vlastní foundation modely netrénuje, používá modely od OpenAI, Anthropic a Meta. Takže blokace PerplexityBot neznamená „ochranu před AI tréninkem“, znamená jen ztrátu viditelnosti v Perplexity výsledcích.

Perplexity publikuje strojově čitelný seznam IP adres na perplexity.com/perplexitybot.json, takže požadavky můžete tvrdě verifikovat. V oficiální dokumentaci Perplexity uvádí podrobné konfigurace pro whitelisting v Cloudflare a AWS WAF — což naznačuje, že řada publisherů měla s PerplexityBot problémy s bezpečnostními pravidly. Pokud máte WAF a PerplexityBot vás má indexovat, zkontrolujte, že není omezen bezpečnostními pravidly na úrovni CDN nebo firewallu.

Je důležité vědět, že PerplexityBot má historicky problematickou pověst. V červnu 2024 britský vývojář Robb Knight publikoval důkazy, že Perplexity obchází robots.txt tím, že používá generický Chrome user-agent místo deklarovaného PerplexityBot. Perplexity tehdy uvedlo, že šlo o konkrétní funkci „ptejte se na URL“, která od té doby byla upravena. V současné dokumentaci Perplexity explicitně odděluje PerplexityBot (systematická indexace, respektuje robots.txt) od Perplexity-User (user-triggered fetch, může ignorovat robots.txt, když uživatel poskytne konkrétní URL). Tohle odlišení je dobré vědět — pro tvrdou blokaci všech Perplexity požadavků potřebujete obě pravidla, plus firewall mechanismy.

Co se stane, když bota zablokujete

Co se stane, když PerplexityBot zablokujete

Pokud v robots.txt zakážete PerplexityBot, Perplexity přestane váš web proaktivně indexovat pro své výsledky. V praxi to znamená: uživatelé Perplexity, kteří se budou ptát na témata, pro která by byla vaše stránka ideální odpověď, ji nedostanou — Perplexity o vašem webu nebude vědět v době odpovědi.

Co blokace NEovlivní:

Trénink AI modelů — Perplexity netrénuje vlastní foundation modely, PerplexityBot se pro trénink nepoužívá. Pokud vám jde o ochranu před AI tréninkem, blokujte spíš GPTBot, ClaudeBot, Google-Extended
Viditelnost v ChatGPT, Claude, Gemini — každá platforma má vlastní crawler, blokace PerplexityBot neovlivní ostatní

Co blokace ovlivní:

Inline citace v Perplexity odpovědích — ty jsou hlavní referrer traffic z Perplexity, takže blokace přímo snižuje návštěvnost z této AI platformy
Budoucí růst traffic — Perplexity měla v dubnu 2026 cca 22 milionů měsíčních uživatelů a rychle roste, hlavně v B2B segmentu. Blokace je dlouhodobě ztrátová

Jedna důležitá nuance: pokud blokujete PerplexityBot, ale chcete zablokovat i user-triggered fetche (kdy uživatel v Perplexity zadá konkrétní URL a chce shrnutí), musíte samostatně blokovat Perplexity-User. A i tak — Perplexity v dokumentaci uvádí, že Perplexity-User může v některých případech robots.txt ignorovat. Pro tvrdou blokaci potřebujete firewall nebo WAF pravidla s IP rozsahy z perplexity.com/perplexitybot.json a perplexity.com/perplexity-user.json.

Doporučení pro B2B

Povolit

<p>Perplexity má ze všech hlavních AI platforem nejsilnější model citování zdrojů — každá odpověď obsahuje inline odkazy na konkrétní weby. Blokace PerplexityBot tedy znamená přímou ztrátu nejhodnotnějšího typu AI viditelnosti: citací, které vedou na návštěvy vašeho webu. Pro typickou B2B firmu nebo e-shop je povolení prakticky povinné, pokud chcete být součástí rychle rostoucího Perplexity ekosystému.</p>

Ukázky robots.txt

Povolit bota

User-agent: PerplexityBot
Allow: /

Zablokovat bota

User-agent: PerplexityBot
Disallow: /

Omezit frekvenci (Crawl-delay)

User-agent: PerplexityBot Crawl-delay: 1

Částečné blokování

User-agent: PerplexityBot
Disallow: /premium/
Disallow: /members/
Allow: /

Historie

V červnu 2024 vypukla kauza kolem Perplexity, kdy vývojáři Robb Knight a Lewis Dale prokázali, že Perplexity obchází robots.txt použitím generického Chrome user-agentu místo deklarovaného PerplexityBot. Zjistili, že Perplexity byla schopna shrnout obsah jejich webu, přestože měli PerplexityBot explicitně blokovaný v robots.txt i na úrovni nginx.

Perplexity v reakci uvedlo, že šlo o konkrétní funkci „ptejte se na URL“, kdy uživatel explicitně zadal odkaz, nikoliv o systematické obcházení. Od té doby Perplexity vyčlenilo samostatný user-agent Perplexity-User pro tyto user-triggered scénáře a v aktuální dokumentaci explicitně uvádí, že Perplexity-User může v některých situacích ignorovat robots.txt, pokud uživatel poskytne konkrétní URL. PerplexityBot (systematická indexace) by měl robots.txt respektovat vždy.

Pro majitele webu to znamená: pokud chcete tvrdou blokaci veškerého Perplexity provozu, samotný robots.txt není stačí. Potřebujete firewall pravidla s IP rozsahy z perplexity.com/perplexitybot.json a perplexity.com/perplexity-user.json, nebo server-level blokace user-agentu.

Časté dotazy

Trénuje Perplexity své modely na datech z PerplexityBot?

Ne. Perplexity netrénuje vlastní foundation modely — používá modely třetích stran (OpenAI, Anthropic, Meta Llama) pro generování odpovědí. Data sebraná PerplexityBot slouží pouze k budování vyhledávacího indexu, ne k tréninku AI. To je zásadní rozdíl oproti GPTBot nebo ClaudeBot. Pokud vám tedy primárně jde o ochranu před AI tréninkem, PerplexityBot je nejmenší starost — soustřeďte se na boty tréninkových crawlerů (GPTBot, ClaudeBot, Google-Extended, CCBot).

Proč PerplexityBot někdy neindexuje obsah přes Cloudflare?

Protože moderní WAF (Web Application Firewall) mechanismy jako Cloudflare Bot Fight Mode automaticky blokují „podezřelé boty“, což občas zahrnuje i legitimní AI crawlery. Perplexity v oficiální dokumentaci explicitně uvádí konfigurace pro Cloudflare a AWS WAF, kterými PerplexityBot explicitně povolíte i s aktivní bot ochranou. Typicky to vyžaduje whitelist pravidlo kombinující user-agent (PerplexityBot) s IP rozsahy (perplexity.com/perplexitybot.json) s vyšší prioritou než obecná bot obrana.

Jaký je rozdíl mezi PerplexityBot a Perplexity-User?

PerplexityBot je systematický indexační crawler — pravidelně prochází web a buduje index. Respektuje robots.txt. Perplexity-User je user-triggered fetcher — aktivuje se, když uživatel v Perplexity zadá konkrétní URL a chce ji shrnout. Perplexity v dokumentaci explicitně uvádí, že Perplexity-User může ignorovat robots.txt, když uživatel poskytne konkrétní URL jako kontext. Pro tvrdou blokaci potřebujete obě pravidla plus firewall. Nuance: blokací PerplexityBot ztratíte viditelnost v automatickém vyhledávání; blokací Perplexity-User ztratíte schopnost Perplexity vás shrnout na žádost uživatele.

Stojí Perplexity za to optimalizovat, když má 'jen' 22 milionů uživatelů?

Ano, z více důvodů. Za prvé, Perplexity uživatelé jsou výrazně nadprůměrní v B2B segmentu — disproporčně zastoupení mezi technickými profesionály, analytiky, výzkumníky. Za druhé, Perplexity poskytuje nejvyšší click-through rate z AI platforem, protože každá odpověď obsahuje inline citace. Za třetí, Perplexity roste rychle — v dubnu 2026 cca 22 milionů uživatelů měsíčně, meziroční růst nad 100%. Pro B2B firmy je Perplexity často druhá nejdůležitější AI platforma po ChatGPT právě kvůli citacím.

Jak donutit PerplexityBot, aby indexoval můj web rychleji?

Perplexity nemá ekvivalent Google Search Console nebo IndexNow pro rychlou indexaci. Přímé urychlení není možné. Co pomáhá: (a) kvalitní sitemap.xml s lastmod daty, (b) čistá struktura HTML a strukturovaná data (Perplexity umí dobře parsovat), (c) backlinky z již indexovaných webů — Perplexity objevuje nové obsahy přes odkazovou síť, (d) výraznější aktualizační frekvence (weby s novým obsahem indexuje častěji). Pro nové weby počítejte s 2–4 týdny, než se začnou v Perplexity výsledcích objevovat.

Je váš web dobře nastavený pro AI crawlery?

Nechte si zauditovat robots.txt a další signály.

Auditovat web zdarma