DiffBot

DiffBot

* Obtenha dados das páginas da Web automaticamente: as APIs de visão computacional da Diffbot transformam a Web em seu banco de dados.* APIs AUTOMÁTICAS: Extraia automaticamenteObtenha conteúdo estruturado de artigos, produtos e outros tipos de página conhecidos.
Por que Diffbot?Estamos focados exclusivamente em obter melhores dados da web.Algumas das razões pelas quais centenas de clientes fazem (centenas de) milhões de chamadas todos os meses: #O melhor extrator de conteúdo da Web: o Diffbot funciona automaticamente - sem regras ou treinamento.Não há melhor maneira de extrair dados de páginas da web.Veja como o Diffbot empilha até outros métodos de extração de conteúdo: Comparação de recursos Teste de qualidade com extração de texto # Identifique páginas automaticamente: use a API Analyze para localizar e extrair automaticamente todos os produtos, artigos, discussões ou imagens enquanto estiver rastreando qualquer site.Analisar dados de produto da API #Detailed: A API do produto retorna automaticamente informações completas do produto, incluindo todos os dados de preços, IDs do produto, marcas e tabelas de especificações completas.API do produto #Clean texto e html: artigos, tópicos de discussão, descrições de produtos e legendas de imagens são retornados em texto puro e HTML higienizado.Comece a testar hoje # Pesquisa estruturada: pesquise conteúdo estruturado a partir de qualquer rastreamento em tempo real usando nossa API de pesquisa, retornando apenas os resultados correspondentes.Além disso ... ¤ Todas as APIs executam Javascript para que o conteúdo seja analisado como um navegador comum.¤ Funciona na maioria das páginas que não estão em inglês, graças ao processamento visual.¤ Normalização de data: os carimbos de dados são normalizados e apresentados no formato padrão RFC 1123 (HTTP / 1.1).¤ Os artigos de várias páginas são reunidos automaticamente em uma única resposta da API.¤ Extração de entidades: a marcação automática identifica os principais tópicos e entidades no texto do artigo.¤ Corrija quaisquer problemas em tempo real com o API Toolkit.¤ A API em massa permite a extração de centenas a centenas de milhares de páginas.¤ Acesse dados de trabalho Crawlbot e Bulk nos formatos JSON ou CSV completos.¤ Rastrear opcionalmente usando uma variedade diversificada de endereços IP.
diffbot

Local na rede Internet:

Recursos

Categorias

Alternativas ao DiffBot para todas as plataformas com qualquer licença

hyscore.io

hyscore.io

O hyScore.io deseja fornecer um serviço de API enxuto, com desempenho e escalável para extrair palavras-chave valiosas de maneira fácil e amigável para o desenvolvedor.
artoo.js

artoo.js

O artoo.js é um código JavaScript que deve ser executado no console do navegador para fornecer alguns utilitários de raspagem.
Data Scramblr

Data Scramblr

Pesquise qualquer empresa por palavra-chave e cidade / local em todo o mundo e faça o download de e-mails, URL e números de telefone como uma planilha do Excel / CSV - Você pode itens como endereços de e-mail, números de telefone etc. no banco de dados do CRM ou na plataforma de correspondência.
DataStock

DataStock

Faça o download de conjuntos de dados da Web pré-rastreados abrangentes, limpos e prontos para uso em uma ampla gama de setores, abrangendo toda a região geográfica.Essa solução é ideal para quem procura conjuntos de dados prontos para uso para realizar análises e obter insights.
morph.io

morph.io

Elimine os problemas da raspagem da Web com a plataforma de raspagem morph.io de código aberto.Com todo o poder para poder raspar qualquer coisa, em qualquer lugar.
Language Detection API

Language Detection API

O serviço da Web identifica o idioma e produz saída JSON compatível com a API do Google Translate.
Code.xyz

Code.xyz

Code.xyz é um editor de código online.Crie APIs de qualidade corporativa, os poderosos blocos de construção de software, com um único clique.