利用php的curl函数采集百度top关键词
时间:2022-01-21 08:20:34|来源:网络精心整理
最近站群,需要收集一些关键词和标题,找来找去发现top.baidu.com里面的关键词和标题不错,就像把它复制下来,但一条一条去复制,太麻烦,于是用php的curl函数,写了一个小工具,输入网址可以采集到关键词,效果如下图所示:
这样直接就可以,获取到想要的标题,好了全部代码如下,复制到一个php文件中,再网站中运行即可:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> <title>百度热点标题提取</title> </head> <body> <div> <form action="" method="post"> <input type="text" style="width:500px;" name="url"/> <input type="submit" value="提交" /> <input type="button" value="复制" id="fuzhi" /> </div> <?php $url=$_POST['url']; if(!empty($url)) { $curl = curl_init(); //$url='http://top.baidu.com/buzz?b=1&fr=topindex'; //设置请求url curl_setopt($curl, CURLOPT_URL,$url ); //是否将头文件输出 curl_setopt($curl, CURLOPT_HRADER,TRUE ); // 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。 curl_setopt($curl, CURLOPT_RETURNTRANSFER,TRUE ); // 运行cURL,请求网页 $data = curl_exec($curl); // 关闭URL请求 curl_close($curl); preg_match_all('/<a(.*?)class="list-title"(.*?)>(.*?)</a>/i',$data,$matches); foreach($matches[3] as $key=>$value) { $sj.=$value.'
'; } } ?> <div> <textarea id="jg" style="height:800px; width:600px;"><?php echo $sj ?></textarea> </div> <script src="/uploads/allimg/190703/142F24214-1.jpg"></script> <script> $("#fuzhi").click(function(){ $("#jg").select(); try { var successful = document.execCommand('copy'); var msg = successful ? '成功复制到剪贴板' : '该浏览器不支持点击复制到剪贴板'; alert(msg); } catch (err) { alert('该浏览器不支持点击复制到剪贴板'); } }) </script> </body> </html>
本文地址:https://www.tabangni.com/phpstudy/210.html
查看更多与“highlight.js”有关的文章
推荐阅读
最近更新
- 01-21利用php的curl函数采集百度top关键词
- 01-21MySQL数据库下用户及用户权限配置
- 01-21详解MySQL实现主从复制过程
- 01-21HTML服务器控件和WEB服务器控件的区别和联系介绍
- 01-21dede栏目列表首页与第一页链接出现重复的解决办法
- 01-21在ASP.NET 2.0中操作数据之五:声明参数
- 01-21小白阐明innerhtml用法 innertext用法 以及innerHTML与innertext的区别
- 01-21在HTML5 canvas里用卷积核进行图像处理的方法
- 01-21笔者解惑JS 通过系统时间限定动态添加 select option的实例代码
- 01-21MySql 5.7.21免安装版本win10下的配置方法