2018年12月5日下午,在沙河校区主教学楼301,中国社科院社会发展战略研究所的陈华珊老师为中国财政发展协同中心的同学们带来了讲座:Social Network Analysis
陈老师首先展示了2004年美国总统大选,关于微博的连接网络的绘图;对于小群体分析(大学生社团内部朋友关系网络图);紧接着老师提出:为什么采用关系的视角分析文本?或者说网络的视角?是因为小数据时代的两个不足:传统数据样本小,并且有意识地忽略关系,因为假设要求相互独立。对于真实的社会现象,存在着:趋同性+互动=社会发生机制,要对社会进行动态的分析,而传统的模型,假设的关系是连续不变的、单调的,但是现实的社会不是这样的,从这个角度我们可以把网络视角引进进来,通过网络的状态进行分析。
在介绍单模网和双模网时,陈老师说到有多个人的时候需要更多层次的网,到那时多个层析尽量下降维度,来简化处理。而后对网络矩阵、无向网、附属网等概念的与应用进行了讲解。在此之上,老师介绍了几款可视化工具的优势与区别,其中Gephi\Pajek点菜单就可以用,R/igraphy需要代码才能使用。并进一步用Gephi进行了现场展示,在场同学表现出极大兴趣。
在基本测量概念与指标这一部分,陈老师介绍了一些基本概念。通过与生活中地铁的例子结合,深入浅出的讲解了中心性、接近中心度、中性中心度、中心势、割点、结构洞等概念。 在讲述更多结点之间的关系时候,老师对三个结点形成的不同三角形结构逐一细致讲解,并告诉同学们在以后应用中一定要具体分析、个例分析,不要被图中显示所误导而得出错误的结论。
在讲解行为数据与网络测量过程中,陈老师指出现在大量的数据都来自于互联网,在大数据的背景下,这些数据都是行为数据,我们在构建数据时可以使用标准的双模数据,找到背后的网络关系和网络结构。陈老师在谈到如何测量友谊的例子时,引申到了Deep South一书中提到的一个社会网络分析理论的经典的案例,通过对表格内容的观察和处理,找到被观察者之间存在的结构。陈老师使用案例里的数据,结合文本分析里的PMI指数,验证了这一案例里的网络,同时使用罚似然图模型对网络进行测量,得出了一个网络特征明显的最优结果。陈老师指出,现在很多专家学者都对微博和VBS进行研究,这一类网络的研究结果往往受到观测范围的影响,因而他希望用一个比较严谨的统计模型来测量出一个相对稳定的网络关系,再进行后续的分析。陈老师同时提出了现在还有用神经网络来做一些特定测量的新型测量方式。
陈老师在讲解网络现象和网络理论时指出了在小世界模型里,可以看到很多三元闭合结构的网络,其数量远远高于随机网络,我们需要关心具体哪些因素影响了网络的生成,通过加入更多的控制或属性变量来进行网络建模。其次介绍了偏好依赖模型,在扩张网络中,每个迭代会加入一个新的节点,与原有的节点产生关联,会发现新增节点与网络中中心度较高的节点有更高的生成关联的概率。最后介绍了无标度概念,也就是中心度的分布规律,通过引用复杂网络的阿喀琉斯之踵的案例,来说明该理论。
在讲解网络建模——多重网络及动态网络的视角时,陈老师指出,在网络建模角度,我们可以考虑多重网络视角,可以把不同类型的网络展开来,分别作为考察因素进行分析,比如朋友网和老乡网之间的关联;还可以做动态考察,考虑过往的网络状态或属性对的现在网络状态的影响,比如抽烟和肥胖关系的关系研究。同时列举了外来人口定居网络和议题讨论网的例子来进一步加深同学们对于概念的理解。
在讲座的最后,陈老师提出了应该把网络和模拟结合起来进行分析,认为在未来的几年,网络建模领域还会有一个较大的发展。陈老师针对大数据的特点,指出我们现在所说的大数据更多的仍处于传统的关系型数据库的范畴,我们需要转变思考方式,更多的把关系的视角放到研究方法里,寻求更加专业的技术团队来进行动态网络的建模。老师同时说到,在网络领域还存在着大面积的空白地带,需要人们充分发挥想象力去进行填补。
中央财经大学 中国财政发展协同创新中心 版权所有 copy right © 2017-2020
邮编:100081
地址:北京市昌平区沙河高教园区
联系电话:010-61776239