又是一年情人节,不知道您身边是否有良人相伴。如果有,祝您长长久久;如果没有,祝您生活如意。但无论您是否单身,都一定对这个问题很感兴趣:“影响一个人单身与否的因素是什么”。我并不擅长写文字,但是分享我对这个问题的思考,因为笔者想讨论的问题不在于问题本身。
首先应该明确我们思考问题的范围。第一,在不同尺度上,从宏观角度看此问题和从微观角度看此问题的结果应该是不一样的。从宏观角度看,这个问题可以类似于“影响一个城市中婚配率的因素是什么”(或者其他在宏观层面上的因变量),我们自然而然地就很容易从城市人均可支配收入、心理咨询率、人口结构、住房结构、医疗健康状况等因素分析,得到一个很自然的结论。在这个层面上,我们更关心如何通过改变研究的因素去调节因变量,或者基于现有数据进行预测。然而,从微观角度看,一个人(个体)是否恋爱、婚配这种状态是一个时间序列。我们更为关心,1、为什么TA现在还单身;2、TA将来脱单的几率是多少,或者说什么时候能脱单。基于我们感兴趣的问题,本文仅从微观,也就是个体的角度去分析,并回答这两个问题。
我们研究的对象是一个人的个体。我们首先确定一个基本假设:
换言之,我们是否单身不完全是随机的,而是我们本人的一些特质,比如性格、社交、经济状况在一定程度上影响了我们是否单身。也就是说,我们单身与否,既是偶然,也是必然。
考虑更一般的情况,对于在某一离散时间上的人个体,我们可以将其抽象为一个随机变量组St,t∈{0,1,2...},t可以代表日、月、年等有意义的离散时间。一个人是否单身同样可视为一个随机变量Y, Y∈{0,1}。由我们的基本假设可知,Yt的分布完全由St决定。对于我们研究的问题一、二,可以转换为如下问题:特定的St如何决定Yt的分布。问题二、St到St+1的转移概率如何确定。您可能已经发现了,这好像就是个隐马尔可夫模型。
如果我们有足够多的观测数据,这个模型是可以被确定的。换言之,我们只需要知道尽可能多的人尽可能详细尽可能长时间的信息,比如长期观察某个人都有哪些朋友,最喜欢的星座,穿衣风格,最近常吃的食物etc,我们就能确定一个模型来回答我们提出的问题,并且为其他人提供预测。但由于我们不可能获得那么多的数据,所以我们需要通过经验选择几个可能解释度最高的变量来预测,基于笔者经验此处提出三个指标:
社交:一个人的社交深度和广度反映了一个人潜在的脱单潜力。以某个样本为中心构建社交网络,社交网络的每个节点为一个人,每条边的权为两个节点的亲密度。利用pageRank衡量节点的重要性。可以尝试从QQ空间提取数据。
个人意愿:一个人本人是否有脱单意愿是一个很重要的指标。对于这个指标可以设计合适的量表对受试者进行 测试。如果无法取得足够数量的受试者,可以尝试采用工具变量法,利用工具变量对个人意愿进行预测。
外貌:此处的外貌泛指颜值、健康状况、衣物整洁程度等。从经验主义而不是政治正确的角度,一个外表整洁的人往往能收获一定好感,加强了进一步发展的可能。因为该因素相对主观,可以采用多人打分求平均值的方法。
很遗憾的是,笔者并没有精力完成数据收集和模型训练。但基于以上分析,该模型也许是可行的。如果您将来实现了该模型,能否告知笔者结果,您可以在主页找到我的联系方式。
我很喜欢《人类简史》中的一个问题,如果算法比你更懂你自己,那么认识你自己还有什么意义。统计学告诉我们,如果模型不准确,只需要增加观测变量,减少隐变量的存在,模型就会更准确。统计学还告诉我们,只要有足够的独立同分布的样本,我们就能解决任何问题。事实上,随着人类收集信息和处理信息的手段的飞速进步,统计学取得了巨大的成功(比如最近很火的chatGPT,也就是统计机器学习的最新作品)。我们开始在几乎所有学科上应用统计学,而得到的结果也与事实相差无二,以至于我们常常在特定问题上忽略了问题本身。
以笔者的学科(生态学)而言,我们要解决的问题是生态系统究竟是如何运作的。统计学确实为我们的研究提供了强有力的视野,但是我们不能忘记,统计学得出的规律只是真实联系的近似,它并不是真理。生态系统没有了数学可以照样运作,因为它有着其存在的客观规律,不以人的意志为转移。统计学只是我们尝试去解释现象的工具,即使我们有一天掌握了一个生态系统运行的全部数据,我们可以说我们完全认识了生态系统吗?我不知道。
让我们回到标题。相较于统计学方法,我认为您应该问问您自己。试着回想一下你和TA的初次见面,你们的每一次聊天,每一次一起度过的时光,每一次意难平。是什么让你们在一起或者没能在一起。是谁的退缩,还是谁的鲁莽,又或者是谁的多虑,还是说谁的懦弱。如果您对谈恋爱不感兴趣,我建议您可以观察一下其他人的爱情,观察总是一件很有趣的事。
你能看到这里我很高兴。其实我想通过这个问题,讨论一下在这个大数据时代我们的未来。只是我回过头发现其实我根本没有写清楚,我最后试图再写一遍吧。回头去看人类的历史长河,思维方式和方法总是在不断发展的,在我们这个时代看上去很先进的方法可能在未来看来是有相当局限性的。跳出思维定式的方法就是回到问题本身看问题,思考问题本身的意义。虽然我们可能穷尽一生也等不到这个时代结束的一天,但眺望未来总是一件快乐的事。