当前位置:首页 > 体育

城市社会学论文 转自《中国社会科学》2016年.第7期|社会学定量论文年度十佳之《互联网与社会学定量研究》

抽象的

摘要:近几十年来,互联网的快速发展改变了社会生活的方方面面。卡斯特认为,网络构建了一种前所未有的社会形式,全面改变了人类社会的生产、权力和文化进程。网络社会的兴起已经成为一种历史趋势和一种新兴的社会结构。互联网的发展也极大地影响了社会学研究,尤其是定量研究。传统社会学研究的对象是现实社会。互联网兴起后,“虚拟社会”开始出现。在博客、微博、微信等网络工具的影响下,很多话题都超越了传统的社会学研究范式。而且“大数据”这一概念的广泛应用和巨大影响,对社会学研究有着更直接的影响。这种影响涉及到很多重要的领域,比如数据来源、研究方法、社会测量等等。众所周知,互联网创造了相对开放的空,推动了网络资源共享的理念,人们开始反思数据的公开化。目前,数据的开放,尤其是公共数据的开放和共享,已经逐渐成为共识。不仅仅是一些门户网站(如谷歌、百度等。)开始提供开放数据,也包括传统的数据管理者(如金融机构、电信运营商和政府部门等。)开始加入这种开放趋势。这些数据与传统问卷收集的数据不同。数据来源和数据结构的这种变化对传统的社会学定量研究方法提出了巨大的挑战。本文试图分析互联网对社会学定量研究方法的影响。

互联网与社会学的定量研究

首先,互联网产生了新的数据生成和获取方法

首先,互联网创造了一种新的数据生成方式。

互联网的发展突破了传统的社会学问卷收集数据。人们在网络上的所有活动都可以被记录下来,并成为一种可以分析的数据格式。比如城市里每天有几十万人使用公交卡通勤上班的信息,就构成了研究城市生活的重要数据库。这些数据的产生为社会学的定量研究提供了新的可能性。就互联网在传统数据生成方面的突破而言,一个重要的例子来自于非社会学领域的“谷歌流感趋势”。2009年2月19日,《自然》发表了一篇关于谷歌预测流感的文章。流感早期,人们会在网上搜索一些特定的关键词。通过收集这些关键词搜索数据,可以很好地标记流感疫情。这个预测模型被命名为“谷歌流感趋势”。Google将预测结果与美国疾病预防控制中心的监测报告进行对比,发现两者惊人的一致。虽然关于谷歌研究的争论仍在继续,但它极大地促进了“用户生成数据”这一新理念在社会科学中的使用,并对社会学的定量研究产生了突破性的影响。社会学定量研究不再局限于传统问卷调查形成的静态和滞后的数据局限,而是走向包括行为、态度、心理和空在内的多维动态数据分析时代。

其次,互联网创造了一种获取数据的新方式。

互联网上新的数据形成方式极大地改变了社会学定量研究中获取数据的方式,不仅极大地增强了数据的可用性,也极大地提高了获取数据的速度。以上海社会组织的空分析为例。上海市社会组织数据来源于上海市社区管理部门网站公布的上海市所有注册社会组织信息。本研究通过“网络爬虫”获取了上海市所有注册社会组织的详细信息,包括组织名称、组织注册码、注册时间、证书有效期、组织类型、注册地点、主管单位、法定代表人、地址、邮政编码、电话号码、网址、主要业务内容、奖惩等。与传统方法相比,这种数据采集方法无疑大大降低了社会科学的研究成本。

随着互联网的发展,研究人员可以快速获取以前由政府统计部门持有的数据。例如,在传统的社会学研究中,贫困指标的测量数据大多来自社会调查和人口普查数据。近年来,学者们利用手机通信记录发现,电话通话记录与其他来源的数据指标高度相关,如人口结构、经济活动、贫困指数、能源使用等。对科特迪瓦的分析发现,移动电话通信数据和贫困指标之间有很强的相关性。通过收集和分析手机通信数据,可以更准确、更快速地评估经济发展。

随着可穿戴智能设备的快速普及,研究人员可以收集人与人之间社交的实时数据。一个研究小组花了一年时间研究大学宿舍的人际行为。他们为所有大学生提供带有特殊软件的智能手机,并跟踪收集他们与朋友的互动,包括50万小时的面对面互动、电话和短信。除了手机,新的传感器技术和智能数据采集设备也层出不穷,如智能眼镜、手环、手表等,不仅可以随时记录人们的社交活动,还可以实时记录各种个人生理信息。这为社会学定量分析的跨学科视野提供了数据基础。

随着互联网的发展,研究人员也可以获得历史数据。通过考察谷歌书籍中的词频,我们可以发现“美国”这个词从复数到单数的演变是一个漫长的过程,内战后从复数到单数的演变略有加快。直到1880年,美国内战结束15年后,“美国”这个词才作为一个单数名词在美国流行起来。再比如,国内有学者利用Google Books的百万册大数据,提取并计算出近300个中国城市历年出现在英文书上的频率,展示并分析这些城市在300年跨度内的国际知名度的历史变化。这显然超出了传统采样数据的范围。

第二,互联网促进了新的社会学研究方法

首先,互联网推动了新的社会学测量方法。

定量社会学研究过程中的一个主要障碍是缺乏适当的测量。一是概念的模糊性;第二,很难获得单个演员的互动数据。由于数据和观测方法经历了多次转换,在一定程度上偏离了概念的原有内涵。因此,定量测量与概念之间的偏差是古典社会学研究中一个长期存在且相对被忽视的问题。在互联网时代,新的数据记录设备和访问手段的出现在一定程度上解决了第二个问题,但量化研究面临的第一个问题可能会变得更加突出。在互联网和大数据的背景下,人们收集或观察到的数据基本上可以分为日志数据或行为痕迹数据。与基于问卷调查的测量数据不同,这类观测数据在时间和空上具有连续性,并且随着技术手段的丰富,数据精度越来越高,数据规模不断扩大。因此,传统的测量方法,如量表、综合指数或因子分析,不再适用或难以提取足够的信息。基于小样本和经典线性回归模型的方差分析无法处理高维数据。在过去的20年里,统计学家开发的正则化回归模型已经广泛应用于数据挖掘和生物遗传科学研究中,并且该模型也适用于大规模社会网络的测量。

除了行为数据,数字化文本也开始进入量化研究领域。基于社交媒体的网络舆情或舆情研究面临着如何处理海量文本信息的问题。对于每天生成的社交媒体信息,传统的人工阅读、人工编码的定性研究方法显然无能为力。在经典文本分割、分类、相似度计算、词频分析等文本算法的基础上,社会科学研究者开始研究如何将日常文本表达与理论概念定量联系起来。该领域涉及主题建模等文本语义分析方法。

其次,互联网促进了实验方法在社会学中的应用。

在社会学研究过程中,导致无法像自然科学那样进行因果推理的一个重要原因在于社会学研究对象的特殊性,即难以进行完整的随机实验。为了解决这个问题,社会科学家设计了多种方法来实现从数据中进行因果推理,包括趋势值匹配、工具变量、结构方程等。在这些方法中,一种“准自然实验”方法近年来引起了社会学家的极大关注。在复杂的现实社会中,我们尝试使用“准自然实验”的方法进行社会干预,获取实验组和对照组更多随机分布的数据,从而做出更严格的因果推断。但是,由于人力物力成本巨大,该技术远远超过传统的抽样调查技术,因此“准自然实验”方法在实际应用中受到限制。

互联网的发展为大规模的“准自然实验”甚至“自然实验”提供了新的手段。例如,在2010年美国国会选举期间,一些学者研究了社会网络对个人行为的影响。设计思路很简单,随机给6100万Facebook用户发送不同类型的“出去投票”消息:参考组只接收“出去投票”消息,而实验组不仅接收到这个消息,还能看到已经投票的好友头像。实验结果出人意料,向用户展示了好友的投票情况,显著改善了实验组的政治投票行为。密友对社交网络中实际投票行为的影响是参考群体“出去投票”的四倍。另一个著名的网络随机实验来自哈佛大学的Chingari教授。为了检验互联网治理的逻辑和操作实践,他的团队做了一个大规模的网络随机实验:在社交媒体上创建大量账号,上传随机分配的文本,然后通过全球计算机网络检测这些文本是否被屏蔽。最后,互联网推动了社会学可复制性研究的普及。再现性的研究对社会学的定量分析具有重要意义。陈、、吴小刚提出建立透明、开源的学术机制,让研究数据和模型可以公开共享,让研究成果得到他人的验证和进一步拓展,从而深化社会学的量化研究。互联网为定量分析的重复性提供了方便的载体。定量研究的模型技术的细节,如样本的删节和数据的编码,都详细地记录在计算机程序的源代码中。算法和数据的披露有利于研究者用自己的方法和视角复制现有的研究成果,从而更有效地改进现有的研究。

第三,互联网拓展了社会学的研究领域

首先,互联网拓展了社会网络的研究。

在传统的社会网络研究中,有两种不同的研究语境:一是个体网络研究,主要考虑个体社会网络的效用和影响(如网络规模、质量、异质性等)。)对个人(如收入、求职、职业提升等。);第二种是全网研究,比如一个组织内部(比如公司或者学校)的人际网络。目前,这些对个体网络和整体网络的研究主要表现出两个特点:第一,大多集中在边界相对清晰、网络封闭的小规模网络结构上,如一个村庄、一所学校、一家公司等;第二,单一类型网络关系的研究缺乏对复合网络关系的考虑。因为无论是个人网络还是整个网络研究,都需要获取个人当前或过去的社交互动信息,需要大量的回顾性调查来收集个人信息,并依赖于回答者回答的网络数据。然而,数据采集的可靠性和数据的规模和覆盖面都受到限制。

随着互联网的发展,尤其是各种社交平台和智能设备的发展,社交网络研究已经突破了这一局限。在互联网上获取社交网络数据的方法比在现实世界中容易得多。同时,在互联网上,个体之间的交互是实时变化的,属于自然跟踪轨迹数据。一些学者利用在中国新浪微博上获得的数据,调查了中国社交媒体空中的群体类型。有的人在国内很多网络社区使用在线问卷发布回答链接,邀请网友自愿回答问题,并对答案进行分析。有研究者获得了个人信息、帖子信息、引用信息等。数以千计的中国学者通过在互联网上搜索,构建了数以千计的学者的论文合作网络,并计算和分析了数以千计的学者的跨国学术资本转移。

其次,互联网深化了对社会参与的研究。

线上线下的互动成为社会学研究的新热点。随着互联网的发展,业主论坛在我国的社区生活和治理中发挥着越来越重要的作用。陈华山以一个所有者论坛为出发点,通过分析复合网络的关系,区分了参与在线讨论的不同类型虚拟社区用户的特征及其与社区在线参与的关系。最后,互联网促进了城市社会学的研究。

国内社会学关注的城市问题带有明显的人文主义色彩,定量的实证分析相对缺乏,如西方城市研究中非常成熟的“社会区域”分析、因子分析等,目前还比较少见。原因是在中国很难获得包含地理信息系统(GIS)的城市数据。互联网时代,随着移动通信、全球定位系统、社交网络等技术在城市生活中的日益广泛应用,人类活动成为分析城市间结构和城市活动的重要数据源空,极大拓展了城市社会学研究的视角。通过这些带有地理信息的数据,我们不仅可以分析城市中活动的行为轨迹,还可以分析城市之间的结构空对人们活动的影响。比如公交刷卡的数据显示了一个城市的基本活动,从中可以找到城市活动的模式和规律;通过将这种新的数据格式与传统的数据格式相结合,我们可以发现以往研究中的许多盲点,更好地理解人们的行为模式与城市中空之间的特征。

4.网络时代的社会学研究:初步思考

互联网尤其是大数据的发展,为社会学研究拓展了新的领域。然而,在很多情况下,学者们只是用新的数据和新的方法重新验证旧的问题。比如对于网络空的研究,虽然学者们在不断强调线上线下的互动,但更多的学者只是把网络空看成是真实社会关系的虚拟映射。那么,互联网给社会学研究带来的只是传统研究课题的网络版,还是它本身就能产生超越传统社会学的全新研究课题?互联网背景下,社会学理论的意义何在?定量研究者如何在理论指导下处理因果判断?

要回答上述问题,学者们需要做大量的实证研究,并在此基础上对理论进行探讨和完善。

首先,在互联网时代,新的数据来源多样、海量、更新迅速,对传统社会学的定量研究提出了严峻的挑战。就互联网数据采集而言,它涉及编程、数据库、网络传输、文本解析、格式转换甚至分布式计算和云存储等各种技术环节,已经成为获取数据的必要手段。随着数据规模的扩大和数据异质性的增加,在分析阶段,建模方法不再局限于传统的基于假设检验的概率统计模型,学科建模、文本语义分析、深度学习、复杂网络建模等都进入了社会学研究者的视野。

其次,随着互联网的快速发展,面对复杂的统计模型和算法,理解所有的统计分析模型已经成为任何研究者都不可能完成的任务。因此,新时期的社会学研究需要突破传统的个体战斗思维,鼓励学者参与不同学科之间的交叉合作。

从技术和方法的角度来看,互联网尤其是大数据的发展给传统社会学方法带来了巨大的挑战,也为社会学定量研究方法的更新和改革带来了难得的机遇。如果我们抓住机遇,抓住新的互联网技术,将其应用于社会学研究,特别是定量研究,就可以进一步研究中国社会特有的问题和社会发展脉络,进而开发出具有中国本土意义的研究课题。

定量群体科学

身份证:社会学

量化群体科学是一个由一群从事量化社会学研究的师生运营的微信官方账号。我们来自牛津大学、斯坦福大学、南京大学、清华大学、中山大学、东南大学和Xi交通大学。

目的:为社会学研究提供最新的量化学术信息;为量化分析师提供一个互相沟通的角落。

内容:重要期刊的数量社会学文献;定量分析软件的使用方法;量化研究者的人文著作。

1.《城市社会学论文 转自《中国社会科学》2016年.第7期|社会学定量论文年度十佳之《互联网与社会学定量研究》》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《城市社会学论文 转自《中国社会科学》2016年.第7期|社会学定量论文年度十佳之《互联网与社会学定量研究》》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/tiyu/1192013.html

上一篇

我国人均国民总收入达9470美元 你到平均线了吗?

下一篇

国防部回应武警部队在深圳活动 武警部队啥活动?

阿里成斑马网络大股东是怎么回事?上汽集团与阿里巴巴合作?

阿里成为斑马网大股东是怎么回事?SAIC与阿里巴巴合作?8月28日,SAIC和阿里巴巴宣布将对斑马网和YUNOS进行战略重组,阿里巴巴将成为斑马网的最大股东。阿里巴巴集团首席执行官张勇表示,SAIC作为中国最大的汽车集团,是阿里巴巴在智联汽车业...

个人信息泄露怎么办 网络安全周之四 | 发现个人信息泄露了怎么办?

H&M公布最新财报亏损超10亿元 在华关闭20家门店 登上网络热搜了!

H&M亏损超10亿元 在华关闭20家门店分析师此前估计,H&M的亏损数额会达到14.1亿瑞典克朗。H&M表示,将不会在即将到来的年度大会上派发股息,而有可能在今年下半年派发。截至2020年财年年底,H&M在中国内地146个城市共拥有445家门店。...

2019暑期档电影数据 暑期最受欢迎的电影是哪一部

近日,国家电影基金办公室提供的数据显示,2019年夏季电影票房为176.53亿元,观影人数为4.9999亿,再次实现了夏季电影的新超越。截至8月31日,全年票房超过1亿的电影有54部,其中国产片25部,进口片29部。夏季档的三个月,《哪吒:妖孩...

2019暑期档电影数据出炉 哪些电影排行前十?

2019暑期档电影数据出炉 哪些电影排行前十?

2019年夏季电影数据发布哪些电影排名前十?根据猫眼和微博电影发布的2019年暑期电影市场数据,《哪吒:恶魔之子的诞生》以无与伦比的9.7分和46.77亿的票房位列2019年暑期电影市场前十,迫使第二名《烈火英雄》的票房达到16.29亿。此外,...

推商网 强引领、破难题,助推电商网络全覆盖——孟彦镇首家镇级电商挂牌营业

推商网 强引领、破难题,助推电商网络全覆盖——孟彦镇首家镇级电商挂牌营业

贵州网讯:为积极响应“大众创业创新”号召,搭建“土货出山”平台,解决农村“买难卖难”困境,全面推进孟雁镇农村电子商务发展。经过近三个月的筹备和建设,孟雁镇第一个乡镇级农村电子商务服务中心于12月13日正式开业。  据了解,乡镇级电子商务服务中心...

未成年人互联网普及率达93.1% 未成年人玩游戏的比例比较高

  • 未成年人互联网普及率达93.1% 未成年人玩游戏的比例比较高
  • 未成年人互联网普及率达93.1% 未成年人玩游戏的比例比较高
  • 未成年人互联网普及率达93.1% 未成年人玩游戏的比例比较高

网站推广途径 网络推广的途径有哪些?

  • 网站推广途径 网络推广的途径有哪些?
  • 网站推广途径 网络推广的途径有哪些?
  • 网站推广途径 网络推广的途径有哪些?