tldr/pages/common/katana.md

# katana

> A fast crawler focused on execution in automation pipelines offering both headless and non-headless crawling.
> See also: `gau`, `scrapy`, `waymore`.
> More information: <https://github.com/projectdiscovery/katana>.

- Crawl a list of URLs:

`katana -list {{https://example.com,https://google.com,...}}`

- Crawl a [u]RL using headless mode using Chromium:

`katana -u {{https://example.com}} {{[-hl|-headless]}}`

- Use `subfinder` to find subdomains, and then use [p]a[s]sive sources (Wayback Machine, Common Crawl, and AlienVault) for URL discovery:

`subfinder {{[-dL|-list]}} {{path/to/domains.txt}} | katana -passive`

- Pass requests through a proxy (http/socks5) and use custom headers from a file:

`katana -proxy {{http://127.0.0.1:8080}} {{[-H|-headers]}} {{path/to/headers.txt}} -u {{https://example.com}}`

- Specify the crawling strategy, depth of subdirectories to crawl, and rate limiting (requests per second):

`katana {{[-s|-strategy]}} {{depth-first|breadth-first}} {{[-d|-depth]}} {{value}} {{[-rl|-rate-limit]}} {{value}} -u {{https://example.com}}`

- Find subdomains using `subfinder`, crawl each for a maximum number of seconds, and write results to an output file:

`subfinder {{[-dL|-list]}} {{path/to/domains.txt}} | katana {{[-ct|-crawl-duration]}} {{value}} {{[-o|-output]}} {{path/to/output.txt}}`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00			`# katana`

			`> A fast crawler focused on execution in automation pipelines offering both headless and non-headless crawling.`
			> See also: `gau`, `scrapy`, `waymore`.
			`> More information: <https://github.com/projectdiscovery/katana>.`

			`- Crawl a list of URLs:`

			`katana -list {{https://example.com,https://google.com,...}}`

			`- Crawl a [u]RL using headless mode using Chromium:`

common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`katana -u {{https://example.com}} {{[-hl\|-headless]}}`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
katana: edit page (#12640) 2024-04-15 04:07:34 +10:00			- Use `subfinder` to find subdomains, and then use [p]a[s]sive sources (Wayback Machine, Common Crawl, and AlienVault) for URL discovery:
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`subfinder {{[-dL\|-list]}} {{path/to/domains.txt}} \| katana -passive`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`- Pass requests through a proxy (http/socks5) and use custom headers from a file:`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`katana -proxy {{http://127.0.0.1:8080}} {{[-H\|-headers]}} {{path/to/headers.txt}} -u {{https://example.com}}`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`- Specify the crawling strategy, depth of subdirectories to crawl, and rate limiting (requests per second):`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`katana {{[-s\|-strategy]}} {{depth-first\|breadth-first}} {{[-d\|-depth]}} {{value}} {{[-rl\|-rate-limit]}} {{value}} -u {{https://example.com}}`
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			- Find subdomains using `subfinder`, crawl each for a maximum number of seconds, and write results to an output file:
katana: add page (#12619) * katana: add page --------- Co-authored-by: Juri Dispan <juri.dispan@posteo.net> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> Co-authored-by: Vítor Henrique <87824454+vitorhcl@users.noreply.github.com> 2024-04-13 16:32:56 +10:00
common/*: switch from using mnemonics to option placeholders (#16034) 2025-03-28 05:26:23 +02:00			`subfinder {{[-dL\|-list]}} {{path/to/domains.txt}} \| katana {{[-ct\|-crawl-duration]}} {{value}} {{[-o\|-output]}} {{path/to/output.txt}}`