5
DiffBot
* Obtenha dados das páginas da Web automaticamente: as APIs de visão computacional da Diffbot transformam a Web em seu banco de dados.* APIs AUTOMÁTICAS: Extraia automaticamenteObtenha conteúdo estruturado de artigos, produtos e outros tipos de página conhecidos.
- Pago
- Web
Por que Diffbot?Estamos focados exclusivamente em obter melhores dados da web.Algumas das razões pelas quais centenas de clientes fazem (centenas de) milhões de chamadas todos os meses: #O melhor extrator de conteúdo da Web: o Diffbot funciona automaticamente - sem regras ou treinamento.Não há melhor maneira de extrair dados de páginas da web.Veja como o Diffbot empilha até outros métodos de extração de conteúdo: Comparação de recursos Teste de qualidade com extração de texto # Identifique páginas automaticamente: use a API Analyze para localizar e extrair automaticamente todos os produtos, artigos, discussões ou imagens enquanto estiver rastreando qualquer site.Analisar dados de produto da API #Detailed: A API do produto retorna automaticamente informações completas do produto, incluindo todos os dados de preços, IDs do produto, marcas e tabelas de especificações completas.API do produto #Clean texto e html: artigos, tópicos de discussão, descrições de produtos e legendas de imagens são retornados em texto puro e HTML higienizado.Comece a testar hoje # Pesquisa estruturada: pesquise conteúdo estruturado a partir de qualquer rastreamento em tempo real usando nossa API de pesquisa, retornando apenas os resultados correspondentes.Além disso ... ¤ Todas as APIs executam Javascript para que o conteúdo seja analisado como um navegador comum.¤ Funciona na maioria das páginas que não estão em inglês, graças ao processamento visual.¤ Normalização de data: os carimbos de dados são normalizados e apresentados no formato padrão RFC 1123 (HTTP / 1.1).¤ Os artigos de várias páginas são reunidos automaticamente em uma única resposta da API.¤ Extração de entidades: a marcação automática identifica os principais tópicos e entidades no texto do artigo.¤ Corrija quaisquer problemas em tempo real com o API Toolkit.¤ A API em massa permite a extração de centenas a centenas de milhares de páginas.¤ Acesse dados de trabalho Crawlbot e Bulk nos formatos JSON ou CSV completos.¤ Rastrear opcionalmente usando uma variedade diversificada de endereços IP.
Local na rede Internet:
https://www.diffbot.com/Recursos
Categorias
Alternativas ao DiffBot para Chrome
56
UI.Vision Kantu
Ferramenta moderna de automação de tarefas e testes de código aberto e o Selenium IDE.O Kantu é uma extensão do navegador, mas também pode automatizar a área de trabalho!Use-o para automação da web, testes da web, preenchimento de formulários, raspagem de tela e RPA (Automação de Processo Robótica)..
1
Lead Bunnies
O software extrator de e-mail Leadbunnies é uma poderosa extensão do Chrome que automatiza o processo de geração de leads para uma empresa, raspando e validando milhares de endereços de e-mail de vários diretórios de negócios on-line e redes de mídia social.
0
artoo.js
O artoo.js é um código JavaScript que deve ser executado no console do navegador para fornecer alguns utilitários de raspagem.
- Grátis
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted