现在有哪些替代方案已经弃用了Google网络搜索API?

What are the alternatives now that the Google web search API has been deprecated?

google web search api已被弃用,并替换为自定义搜索api(请参阅http://code.google.com/apis/websearch/)。

我想搜索整个网站,但在新的API中,只能搜索自定义网站。

有没有一种方法可以用程序搜索整个网页?我能够从Java程序中使用JSON查询旧的API。


是的,Google自定义搜索现在已经取代了旧的搜索API,但是您仍然可以使用Google自定义搜索来搜索整个Web,尽管自定义搜索设置中的步骤并不明显。

要创建搜索整个网站的谷歌自定义搜索引擎,请执行以下操作:

  • 在Google自定义搜索主页(http://www.google.com/cse/)中,单击创建自定义搜索引擎。
  • 键入搜索引擎的名称和说明。
  • 在"定义搜索引擎"下的"要搜索的网站"框中,至少输入一个有效的URL(现在,只需输入www.anyurl.com即可通过此屏幕。以后再谈)。
  • 选择所需的CSE版本并接受服务条款,然后单击下一步。选择所需的布局选项,然后单击下一步。
  • 单击"下一步"部分下的任何链接导航到控制面板。
  • 在左侧菜单的"控制面板"下,单击"基本"。
  • 在"搜索首选项"部分,选择"搜索整个网站",但强调包含的网站。
  • 单击保存更改。
  • 在左侧菜单的"控制面板"下,单击"站点"。
  • 删除在初始设置过程中输入的站点。
  • 现在,您的自定义搜索引擎将搜索整个网站。

    定价

    • 谷歌自定义搜索每天为您提供100个免费查询。
    • 之后,每1000个查询就要支付5美元。
    • 每天最多有10000个查询。

    来源:https://developers.google.com/custom search/json api/v1/overview定价

    • 搜索质量远远低于普通的谷歌搜索(没有同义词,"智能"等)。
    • 谷歌似乎甚至计划完全关闭这项服务。


    与竞争对手(低于竞争对手)或与其他Google API相比,Google自定义搜索(如评价最高的答案中所提倡的)效果很好,但价格非常昂贵。它有一个小的免费层(每天100个查询),每1000个查询的价格非常高,为5美元。

    他们提供了升级到网站搜索的选项,这有点好的价格,但这是为了搜索一个网站(你自己的),所以它确实是相当不同的东西-不是升级。

    主要的选择似乎是:

    Bing搜索APIhttps://datamarket.azure.com/dataset/5ba839f1-12ce-4cce-bf57-a49d98d29a44免费提供5000Q/月,价格从每便士5个查询开始,没有硬性限制。

    更新:2016年底,为了支持其Azure对应的"认知服务Bing搜索API",该API被关闭:https://azure.microsoft.com/en-us/services/cognetic-services/search/搜索/

    请参阅此处了解定价表,1000笔交易的起价为3美元/m。除非我找不到东西,否则很贵。

    雅虎老板搜索API更新:于2016年3月31日中止。http://developer.yahoo.com/boss/search/整个网络搜索的价格从12个查询/便士开始。

    有些我以前没听说过:

    http://www.gigablast.com/searchfeed.html

    网址:http://www.faroo.com/hp/api/api.html

    http://www.commoncrawl.org网站/

    http://www.entireweb.com/search_api/implementation/[停产-如下所述]

    在这篇文章中有一些讨论。[因话题偏离而关闭,现在不见了]


    你可以像浏览器一样发送它们,然后解析HTML,这是我一直在做的,即使是像YouTube这样的事情。


    自定义搜索控制面板底部有一个选项:"要搜索的网站",您可以选择"搜索整个网站,但强调包含的网站"

    Custom Search Control Panel - Sites to search


    Faroo有一个免费的网络搜索API


    我刚从普通的爬行中发现这个。

    http://www.commoncrawl.org网站/

    可能是我们都在寻找的答案!!


    文件上方有一条注释:

    Note: The Google Web Search API has
    been officially deprecated as of
    November 1, 2010. It will continue to
    work as per our deprecation policy,
    but the number of requests you may
    make per day will be limited.
    Therefore, we encourage you to move to
    the new Custom Search API.

    反预测政策说他们将继续运行API 3年。因此,如果您已经有了一个使用旧API的应用程序,那么您就不必急于改变现状。如果您正在编写新的应用程序,请使用自定义搜索API。关于如何在Python中实现这一点,请参阅这里的答案,但是对于任何语言来说,这个想法都是相同的。


    有一个免费的Java API称为jFieldWebStk,它使用了已经提到的Faroo:http://www.ke.tu-darmstadt.de/resources/jfreewebsearch


    您可以从Google自定义搜索主页(http://www.google.com/cse/)创建"无处不在"的自定义搜索引擎。在添加新引擎时,只需单击"高级"。在这里,您可以提供schema.org网站类型。Thing'是最通用的类型,它覆盖了所有的Web。


    GigaBlast提供了一个廉价的Web搜索API:http://www.gigablast.com/searchfeed.html