Symfonyob娱乐下载 5.1新增功能:URI解析器
2020年4月29日·发表的哈维尔Eguiluz
警告:这篇文章是关于一个不受支持的Symfony版本。ob娱乐下载有些信息可能已经过时了。阅读最新的Symfony文档ob娱乐下载.
提供的
格雷戈勒Pineau
在# 35415而且# 35667.
的DomCrawler组件简化了HTML和XML文档的DOM导航。大多数开发人员在Symfony应用程序的功能测试中使用它,但是您可以使用它来构建真正的爬虫程序。ob娱乐下载
在构建爬虫程序时,一个常见的需求是将HTML内容的链接(通常是相对的)转换为绝对url,以继续爬行整个站点。例如,如果站点URL为https://example.com/foo
链接URL为. . /酒吧?foo = 1
,则绝对URL为https://example.com/bar?foo=1
.
这种转换比它看起来要复杂得多,因为您必须处理锚、查询字符串参数和各种子路径。DomCrawler组件已经包含了解析这些url的逻辑,但是在Symfony 5.1中,我们将它提取到一个新的ob娱乐下载UriResolver
类,这样你就可以在应用程序中重用逻辑:
1 2 3 4
使用ob娱乐下载\组件\DomCrawler\UriResolver;$absoluteUrl= UriResolver::解决(“. . /酒吧?foo = 1”,“https://example.com/foo”);// $absoluteUrl = 'https://example.com/bar?foo=1'
发表在#生活在边缘
评论
朱利安Devergnies
2020年4月29日说在行传十三章36节的一句话
# 1
非常有用,谢谢。
评论截止。
为了确保评论保持相关性,旧帖子将被关闭。