Hello,你好,今天,今天,我们如何大量抓取网页上的数据,如何抓住汽车投诉量,如何大量抓取网页上的数据,这也是一个粉丝问的问题。他要买辆车,想看看各家企业的高收量怎么样。(威廉莎士比亚,哈姆雷特,车,车,车,车,车)不要多说话,我们自己动手吧。如果你进来后知道各企业的投诉量和投诉的车型排名,直接拉到最后就可以了。
一、网页分析
我们以捕捉车质网的汽车投诉为例,说明了如何大量收集数据,如下图所示。下图分别是从第一页到第三页的网站。我们可以看到这三页的网址。只有123(以红色显示)才知道对应的页码不同。剩下的都一样。
二、数据捕获
然后打开excel,单击“数据功能”组在网站上查找。单击“高级选项”,然后在输入框中单独放置表示页码的数字。您可以按一下「加入零件」来加入输入方块。设置完成后,直接单击“确定”
这样我们就进入导航器的界面,在这个网页上,power query都抓住了两个内容,我们可以具体看到我们需要的数据。其中table0是我们要抓取的数据。直接选择table0选项并单击“转换数据”即可。然后我们进入powerquery的编辑界面。
然后单击高级编辑器,在let前面输入(x as number) as table=,在URL中将“1”更改为(x),直接单击即可
在这种情况下,将以前的操作封装到函数中。输入相应的号码,然后单击“调用”转到该页码的数据。
然后单击左侧的空白区域,右键单击以选择新建查询,浏览到其他源,然后选择空白查询。然后在编辑栏上输入={1.通过输入100}单击回车,可以得到从1到100的序列。然后单击“表”将查询转换为表,然后单击“确定”
然后选择添加列,找到用户定义的函数,从功能查询中选择表0,单击“确定”,power query开始捕获数据。其中,捕获100页网页数据的过程可能会很长。这里大约需要三分钟。捕获完成后,您将在每个序列后获得一个表。单击左箭头、右箭头、右箭头和反向箭头可以扩展数据。移除原始列名前面的复选标记,然后单击“确定”删除添加的序列。这样就可以了。从头关闭并上载可以将数据加载到Excel中。因为数据很多,所以这个过程也需要更长的时间,这里大约需要一分钟。(大卫亚设,Northern Exposure)。
三、统计分析
数据加载到Excel中后,可以通过透视表快速分析数据。下图基于从车质网投诉记录中收集的3000个数据,通过透视表获得投诉品牌和投诉车科的排名。这里3000个数据是近一个月的投诉量。
这就是我们大量收集100页网页数据的方法,以及确定各企业投诉排名的方法。整个过程大约需要7分钟,大部分时间花费在数据收集和加载上。(大卫亚设)。
怎么样?你学了吗?快点开始吧。
我是埃克塞尔。继续分享更多的excel技术。
1.《【excel怎么跑数据】抓取了100页的网页数据,还在复制粘贴吗?使用Excel只需要7分钟》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《【excel怎么跑数据】抓取了100页的网页数据,还在复制粘贴吗?使用Excel只需要7分钟》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/2482168.html