5
DiffBot
* Obtenha dados das páginas da Web automaticamente: as APIs de visão computacional da Diffbot transformam a Web em seu banco de dados.* APIs AUTOMÁTICAS: Extraia automaticamenteObtenha conteúdo estruturado de artigos, produtos e outros tipos de página conhecidos.
- Pago
- Web
Por que Diffbot?Estamos focados exclusivamente em obter melhores dados da web.Algumas das razões pelas quais centenas de clientes fazem (centenas de) milhões de chamadas todos os meses: #O melhor extrator de conteúdo da Web: o Diffbot funciona automaticamente - sem regras ou treinamento.Não há melhor maneira de extrair dados de páginas da web.Veja como o Diffbot empilha até outros métodos de extração de conteúdo: Comparação de recursos Teste de qualidade com extração de texto # Identifique páginas automaticamente: use a API Analyze para localizar e extrair automaticamente todos os produtos, artigos, discussões ou imagens enquanto estiver rastreando qualquer site.Analisar dados de produto da API #Detailed: A API do produto retorna automaticamente informações completas do produto, incluindo todos os dados de preços, IDs do produto, marcas e tabelas de especificações completas.API do produto #Clean texto e html: artigos, tópicos de discussão, descrições de produtos e legendas de imagens são retornados em texto puro e HTML higienizado.Comece a testar hoje # Pesquisa estruturada: pesquise conteúdo estruturado a partir de qualquer rastreamento em tempo real usando nossa API de pesquisa, retornando apenas os resultados correspondentes.Além disso ... ¤ Todas as APIs executam Javascript para que o conteúdo seja analisado como um navegador comum.¤ Funciona na maioria das páginas que não estão em inglês, graças ao processamento visual.¤ Normalização de data: os carimbos de dados são normalizados e apresentados no formato padrão RFC 1123 (HTTP / 1.1).¤ Os artigos de várias páginas são reunidos automaticamente em uma única resposta da API.¤ Extração de entidades: a marcação automática identifica os principais tópicos e entidades no texto do artigo.¤ Corrija quaisquer problemas em tempo real com o API Toolkit.¤ A API em massa permite a extração de centenas a centenas de milhares de páginas.¤ Acesse dados de trabalho Crawlbot e Bulk nos formatos JSON ou CSV completos.¤ Rastrear opcionalmente usando uma variedade diversificada de endereços IP.