分类
杂谈

杂谈——高考志愿填报分析

2015年,阁主的表妹高中毕业。家长打电话来说,看看能否给表妹一些报考的建议。

阁主思来想去,也没有什么特别好的渠道来了解这些学校。本来想着看看网上有没有适合的网站提供一些有价值的信息,结果发现然并卵。各个网站上,所提供的志愿参考,都是基于过去年份的分数来推荐的。那么,在分数线发生变化的情况下,给出的参考价值能有多大,阁主心里打了个不小的问号。

阁主了解到,2015年,河南省已经是出分后报志愿,并且是平行志愿。在收集信息的过程中,阁主也了解了下志愿投档的规则。

首先,将全省所有的考生(当然,分文理科)进行排序(首先比较总分,总分相同的话,比较语文、总分和语文相同的话,比较数学,如果前面三项都相同,就比较英语听力)。然后,按照排名顺序的先后,对每个考试依次按照志愿顺序进行投档。

这样以来,高考志愿填报的大小年情况就会小很多。由此,阁主便有了根据排名顺序,来进行一个录取可能性预测的分析。阁主认为,几十万人的独立决策,其结果应该是符合统计规律的。然后,阁主就收集了从2012年到2014年,三年间河南省理科类高考考生的分数段数据,和各个一本高校的投档线数据。这里需要说明为什么使用投档线数据,因为阁主找不到录取分数线数据,只能找到投档线的数据,而一般来说,投档后,接受专业调剂,被退档的可能性较小。

阁主对分数段数据和高校投档线数据进行统计分析后发现,虽然每年各个高校的录取分数都会发生变化,但是最低投档线考生的分数在全省学生中的排名比例基本是一致的。

由此,阁主认为,可以通过高考成绩在全省考生中所占的比例,来大致预估考生相匹配的学校范围。于是,阁主就出炉了第一版的河南省高考志愿填报参考。并发布在百度文库上,希望能够帮到需要进行志愿填报的莘莘学子。

其后2016、2017、2018年,阁主每年都会对这个参考进行更新,并发布在百度文库上。2018年,阁主对志愿填报参考进行了界面优化,实现了输入分数,自动生成内部跳转链接的功能,做了一些基本的说明。

2019年,阁主的侄女在河北省参加高考。于是,阁主又收集了从2012年到2018年的河北省理工科分数段数据和投档分数线数据,并进行数据分析和汇总。

近年来,由于百度文库的日益壮大,以及有关部门对共享文档方面的要求加严。百度文库的上传、审核效率和体验有明显下降。2018年,阁主在获取到分数段数据后的第一时间就进行了文件更新和上传工作,但由于审核速度和准确性的限制,导致文件在公众面前面世的时候,本科一批的志愿填报工作基本上处于尾声了。

为了避免2019年再次出现这种情况,阁主决定提前上传文件和审核。但是这中间有一个矛盾:阁主的志愿填报参考,最重要的一环,是需要获取考生的排名占比情况,但是提前上传文件,没办法在里面添加排名占比计算表。于是,阁主在最新版本的高考志愿填报参考中,使用了excel2013开始提供的webservice函数。webservice函数能够通过访问指定网址获取数据。于是阁主自己架设服务端,在线提供排位数据。所好的是,阁主的个人博客使用的是独立主机,可以相对自由的架设服务。而对于不能使用webservice函数的情况(比如excel版本过低等),也会在相应位置提供一个超链接,并引导使用者使用浏览器访问的方式获取占比数据。

文末附上2019年河南、河北两省的高考本科一批理工科志愿填报参考以飨读者。

2019年河南省理工一本志愿填报参考  2019年河北省理科一本志愿填报参考