如何注册球员?
这个问题的核心其实是,怎样在官方网站上录入真实存在的人物信息! 我们知道,足球运动员注册是有年龄限制的(其他项目不清楚),以国内为例,职业联赛注册球员的年龄上限是22岁,青年联赛(u17、U15)和业余球队(无高水平青训梯队、非职业俱乐部)注册球员没有年龄上限,但是有身高要求;同时,一个球员只能注册一个会员协会(省、自治区、直辖市体育局认可的),但可以在多个俱乐部注册并参加比赛。
所以问题就变成了两个小问题: (一)怎样在一个已经存在的球员身上找到合理的年龄和身高数据; (二)怎样确定一个“真实”的人,与他/她所代表的球员身份进行绑定。 而这两个问题又可以归结到一个更大的问题:怎样在已有数据库中新增合适的记录。 如果可以随意编造数据,这个问题就非常简单了——直接造个假的数据库就行了。但事实上数据库的每一条记录都是有源可溯的,造假必须考虑以下问题:
1. 造假的来源:即从哪里寻找合适的数据来填充进空白数据库(比如各地体校、省市级体工队等曾经建立过比较完善的档案,这些档案虽然数字化但仍在网络上遗留痕迹);
2. 造假的对象:即是将假数据输入哪类网站,因为不同的网站对数据的处理方式不同,而很多网站为了数据完整性的考虑,会对历史数据进行追溯检查,因此需要小心行事;
3. 怎么伪造得看起来像真的一样,并且不会引起注意。 这三个问题的答案就是黑客技术的全部学问。 但如果像题主所说,数据库中的信息和现实世界中的实体没有任何关系的话,那么这个问题就简单了,只需要从已有的数据源里搜刮足够数量的真实样本用于训练机器学习算法就可以了。
当然,实际的情况可能是既不能完全无视实体的存在胡乱编造数据,也不能把真实世界中的个体逐一录入到计算机之中。一种可能的情况是,一个群体被赋予了类似身份这样的虚拟身份,而每一个真实的个体在这组数字背后都有其相应的运动表现与成绩作为依据。这样即便这个群体中的成员的身份被公开,也不会影响对他们的评价。