分类
BI/PBI/PY学习交流 excel知识日志 Office应用日志

Excel应用——使用Excel的PowerQuery获取党史题库

建党100周年,举办一个党史有关的答题活动,让广大党员参与进来,既回顾了党史,又提高了认识。这是很合请很合理也很合逻辑的。

既然是学习和答题,那么划定一个出题范围,乃至给出一个题库来,当然也是皆大欢喜的。

那么,如何把题库下载下来,放到excel中,方便自己练习和学习呢?

为了解决这个问题,今天,阁主就带你使用Excel自带的PowerQuery,体验一把网络数据抓取功能。

首先,我们要获得数据的来源网址:
使用微信电脑版,从相关活动二维码打开的内置浏览器窗口上方,点击复制链接按钮,复制链接并粘贴到浏览器中打开。

等待浏览器加载完毕,可以看到题库被分割成了40页,记住40这个数字,后面用到。点击F12打开浏览器开发者工具。在浏览器开发者工具中,选择“网络”选项卡。然后点击网页下方的2,进行切换页操作。

我们点击“2”以后,“网络”选项卡下面会多出来一行记录,这时候,点击这条记录的名称列文本。

这时候,会在右侧出现一个新的视图栏,选择里面的“标头”选项卡,复制“请求URL”。这里是“https://hezuo.btime.com/question/getquestion?page=2”

打开Excel,新建空白工作簿。依次选择【数据】选项卡,【获取数据】组,【获取数据】按钮下拉选择【自其他源】里面的【自网站】按钮(也可以使用【获取数据】中的【自网站】按钮,效果是一样的)

在新弹出的对话框里面粘贴网址并【确定】

这时候,Excel会自动打开PowerQuery编辑器,下一步就在PowerQuery编辑器中操作了。在Powerquery中依次点击Record、List和选项卡中的“到表”按钮。

使用数据预览窗口中列标题中的“扩展”按钮,将Record扩展为表格

在Answer列上点击“扩展”按钮,将候选项扩展为多行文本。这里分隔符选择自定义,勾选使用特殊字符连接,然后选择“换行和回车符”。

选择Column1.Type列,使用替换值功能,将1替换为单选,2替换为多选

到了这一步,我们已经完整的实现了从网页获取单个页面数据并转换为需要的形式的功能。下一步,我们使用“创建函数”功能,进行多个页面数据的获取。

创建函数对话框中输入函数名称,这里取的名字叫“获取数据”。

右键点击“获取数据”,选择“高级编辑器”,打开高级编辑器。

在高级编辑器中,可以看到有一个括号,里面为空。这就是PowerQuery公式中,放函数参数的地方。

在括号中填入x,然后把”page=2″中的”2″删掉,后面加上”&Number.ToText(x)”,确定。

,这表示定义了一个函数参数x,根据x值动态生成网址进行数据获取。

在选项卡中,选择【新建源】→【空查询】

在公式编辑栏输入“={1..40}”,代表是一个从1到40的列表

点击选项卡中【到表】按钮,将列表转为表

切换到“添加列”选项卡,点击“调用自定义函数”按钮,添加一个基于自定义函数的列

在新添加的列标题栏,点击扩展按钮

点击【关闭并上载至…】按钮,将数据返回到Excel中。

大功告成。

总结:在这个实例中,我们通过对浏览器开发者工具,Excel的Powerquery的综合运用,将一个40页的题库,快速进行全文获取,并在Excel中进行呈现,方便下一步的学习与练习工作。如果掌握了这套方法的思路,以后可以快速从网络上获取我们需要的宝贵数据,方便工作使用。

分类
未分类

读书笔记——《数据可视化》01

第1章 数据可视化简介

1.1 可视化释义

人眼:“人眼是一个高带宽的巨量视觉信号输入并行处理器,最高带宽为100MB/s,具有很强的模式识别能力,对可视符号的感知速度比数字或文本快多个数量级,大量视觉信息的处理发生在潜意识阶段。”(P2)

可视化:Visualize和Visualization。Visualize “生成符合人类感知”的图像。Visualization,“使某事、某物可见的动作或事实”;对某个原本不可见的事物在人脑中形成一幅可感知的心理图片的过程或能力。利用人眼的感知能力对数据进行交互的可视表达及增强认知的技术,称为可视化。它将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息。(P2)

可视化是认知的过程,即形成某个物体的感知图像,强化认知理解。可视化的终极目的是对事物规律的洞悉,而非所绘制的可视化结果本身。(P3)

可视化的三个功能:信息记录、支持对信息的推理和分析、信息传播和协同(P4-P6)

可视化能显著提高分析信息的效率,其重要原因是扩充了人脑的记忆,帮助人脑形象地理解和分析所面临的任务。(P5)

1.2 可视化简史(P8-P22)

  • 17世纪前:图表萌芽 地图、城市交通图
  • 1600-1699:物理测量 太阳黑子(邮票图表法)风场分布(向量可视化)
  • 1700-1799:图形符号 地球等磁线可视化、三维金字塔颜色系统可视化、时间线图→柱状图、折线图、序列图、饼图
  • 1800-1900:数据图形 流图、天气可视化、堆叠饼图(玫瑰图)
  • 1900-1949:现代启蒙 太阳黑子、地铁图
  • 1950-1974:多维信息可视化编码 Jacques Bertin《图形符号学》、计算机
  • 1975-1987:多维统计图形
  • 1987-2004:交互可视化
  • 2004-至今:可视分析学

1.3 数据可视化详解

1.3.1 数据科学的发展

信息管理、信息系统和知识管理学科基本层次模型“数据、信息、知识、智慧”(DIKW模型),它以数据为基础架构,按照信息流顺序依次完成从数据到智慧的转换,四者之间的结构和功能方面的关系构成了信息科学的基础理论,在数据科学中,这种模型也作为一种数据处理流程,完成从原始数据的转化(P23)

数据:数据是对目标观察和记录的结果,是关于时间、地点、事件、其他对象或概念的描述。在表达为有用的形式之前,数据本身没有用途。(P24)

信息:信息是被赋予了意义和目标的数据。(P24)

信息的两类特性:结构性与功能性、象征性或主体性。信息是组织好的结构化数据。信息是通用的以符号和信号形式存在的数据。(P25)

知识:知识是被处理、组织过、应用或付诸行动的信息,又是框架化的经验、价值、情景信息、专家观察和基本直觉的流动的混合。(P25)

智慧:知道为什么,知道如何去做。(P25)

1.3.2 数据可视化的意义

数据可视化借助于人眼快速的视觉感知和人脑的智能认知能力,可以起到清晰有效地传达、沟通并辅助数据分析的作用。(P25)

数据可视化的真善美。真:是否正确的反映了数据的本质。善:可视化所表达的意象对社会和生活具有什么意义和影响(帮助公众理解人类社会发展和自然环境现状,实现政府与职能部门的透明??)。美:可视化的艺术完美型,形式与内容是否和谐统一,是否有艺术个性,是否有创新发展。(P26-P28)

1.3.3 数据可视化的分类

科学可视化信息可视化可视分析学 (P29)

科学可视化数据类别:标量(密度、温度等)、向量(风向、力场等)、张量(压力、弥散等)三类。(P29)

科学可视化分类:标量场可视化、向量场可视化、张量场可视化

标量场可视化

标量是指在每个记录的数据点上有一个单一的值。(P30)

标量场可视化标准做法:1、数值直接映射为颜色或透明度;2、根据需要抽取等值线或面;3、将数据场视为能产生、传输、吸收光的媒介,直接体绘制。(P30)

向量场可视化

向量场在每一个采样点处是一个向量(一维数组),向量代表某种方向或趋势。(P30)

向量场可视化标准做法:1、粒子对流法(模拟流动);2、纹理图像法;3、图标法(P30)

张量场可视化

张量是矢量的推广。张量场可视化方法:基于纹理、几何和拓扑。(P30)将张量场转为向量场(P30)

科学可视化相关研究主题(IEEE Conference on Scientific Visualization 2012)(P31-P33)

信息可视化

信息可视化处理的对象是抽象的、非结构化数据集合(文本、图标、层次结构、地图、软件、复杂系统等)(P34)

时空数据可视化、层次与网络结构数据可视化、文本和跨媒体数据可视化、多变量数据可视化 (P34)

信息可视化相关研究主题(IEEE conference on Information Visualization 2012)(P34-P36)

可视分析学

以可视交互界面为基础的分析推理科学,它综合了图形学、数据挖掘和人机交互等技术,以可视交互界面为通道,将人的感知和认知能力以可视的方式融入数据处理过程,形成人脑智能和机器智能优势互补和相互提升,减少螺旋式信息交流与知识提炼路径,完成有效的分析推理和决策。(P36)

可视分析学相关研究主题(IEEE Conference on Visual Analytics Science and Technology)(P37)

1.3.4 数据可视化与其他学科的关系

数据可视化与信息图、信息可视化、科学可视化及统计图形密切相关,也是数据科学中必不可少的环节。(P38)

图形学、人机交互(P38)

数据库与数据仓库(P39)

数据分析和数据挖掘(P40)

面向领域的可视化方法和技术(P41)

信息视觉设计(P42)

1.4 数据可视化研究挑战

计算能力的可扩展性、感知和认知能力的局限性、显示能力的局限性(P43)

分类
计算机知识日志

计算机应用——使用IPBan实现入侵防护

昨天是918。

抗日英雄永垂不朽。

但是有人想要黑掉阁主的服务器。

而且似乎好像已经写入了一部分内容?但是被腾讯云监控到了。

腾讯云提醒了阁主。

阁主就把网站关了,晚上再分析研究。

晚上把日志导出来,放进PowerBI desktop里面,分析一下~

这里可以看到,有一个IP(52.151.40.180)独领风骚~

那就看它都访问了什么?

哦~请求了一堆并不存在的文件~

正常人不干这事儿。

得封掉它。

阁主懒!

咋办?

搜~

于是阁主找到了Fail2ban,wail2ban等等一系列方案。

但是阁主点进去发现,要么就是针对*nux系列的,要么就是只支持事件查看器的。

有没有支持windows操作系统上apache的?

有,IPban

阁主费了九牛二虎一起吹灰之力终于找到了IPban,下载,安装解压到相应目录,修改配置文件,启动软件,启动服务器,测试,OK,完事儿。

嗯。希望IPban正常履职,更希望被ban掉的IP越少越好~

分类
BI/PBI/PY学习交流

PBI学习——使用nginx stream反向代理实现powerBI数据集的远程访问

没有废话版:

1、打开PBID软件,打开数据集

2、查找msmdsrv.port.txt文件,确认PBID使用的端口(假设为8888)

3、下载安装nginx,修改配置文件,设定反向代理端口(假设为6666)启用stream反向代理。启动nginx服务器。

示例配置:

worker_processes  1;

events {
    worker_connections  1024;
}
stream{
    server{
        listen 6666;
        proxy_connect_timeout 1s;
        proxy_timeout 3s;
        proxy_pass 127.0.0.1:8888;
    }    
}

4、在Excel中选择【数据】→【获取数据】→【来自数据库】→【自Analysis Services】在弹出的对话框【服务器名称】项中填入服务器地址及端口号。假如服务器网址为pbi.cuijiange.com,那么地址栏就应该输入pbi.cuijiange.com:6666;假如没有网址,而是使用的IP地址,那么就输入IP:port

5、【登陆凭据】项选择“使用下列用户名和密码”,在输入框内输入服务器端的用户名和密码


废话版:

昨天前几天,学习群里,潘老师给下达了一个任务:实现使用A电脑上的Excel访问B电脑上的PBI数据集。

PBID本质上就是一个服务端和客户端的集合体,服务端使用的是Microsoft家族成熟的Microsoft SQL Server Analysis Services,那么就可以通过连接SSAS的方法进行连接。

那么,具体是怎么连接的呢?下面跟着阁主,来一探究竟吧。

第一步,我们需要打开PowerBI desktop软件。如果不打开软件,那么后面我们就会找不到工作区目录的。

第二步,我们需要找到PBID的SSAS服务的端口号。经过老师的指导,阁主了解到PBID的SSAS服务的端口号并不是固定的,每次打开PBID都会发生变化。在我们打开PBID的情况下,PBID会在我们的硬盘中生成一个SSAS工作区目录analysisServicesWorkspaceXXXXXXXXX,我们可以从该目录的Data子目录中的msmdsrv.port.txt获得端口号。阁主就按照老师给的参考地址,去C:\users\淬剑阁阁主\appdata\local\Microsoft\Power BI Desktop\AnalysisServicesWorkspaces目录下寻找,结果没有找到。后来,阁主使用everything搜索msmdsrv.port.txt,在C:\users\淬剑阁阁主\Microsoft\Power BI store Desktop\AnalysisServicesWorkspaces目录下找到了相应的配置目录。为什么找不到呢?阁主猜测,可能是因为阁主用的是应用商店版本的PowerBI desktop,版本不同导致文件的位置也不一样。在这里,为了方便朋友们快速找到相应的位置,阁主写了两个带系统变量的地址语句,复制到“资源管理器”地址栏回车就能找到所需要的目录。

应用商店版:
%USERPROFILE%\Microsoft\Power BI Desktop store app\AnalysisServicesWorkspaces
安装版:
%LOCALAPPDATA%\Microsoft\Power BI Desktop\AnalysisServicesWorkspaces

找到了工作区文件夹。如果有童鞋发现这个文件夹是空的,那么是因为你没有打开PowerBI软件,请把PowerBI Desktop软件打开。

如果您的PowerBI Desktop已经是打开的,那么这个位置应该就出现了形如【AnalysisServicesWorkspace123456789】这样子的文件夹,请打开这个文件夹,会看到有一个【Data】目录和一个【pbiworkspace.lock】文件,打开Data文件夹,打开里面的文本文档【msmdsrv.port.txt】,里面的端口号就是我们第二步需要找到的端口号啦~

第三步,架设nginx stream反向代理服务器。nginx是一款开源的多平台服务器软件,今天我们借助他的stream代理功能,将外部访问转换为本地访问,以突破ssas服务只能够本地访问的限制。

首先,我们要有一个nginx的安装包。很多网站上都可以下载到这个安装包,在这里,阁主还是推荐您使用官方地址http://nginx.org/en/download.html来下载,可以保证软件的有效性。

安装好nginx服务器之后,我们还需要对它进行相应的配置,以启用stream反向代理功能。配置文件的默认路径是【程序目录\conf\nginx.conf】示例代码已经放在上面了,各位童鞋可以参照修改哦~

当然,如果不便于直接修改nginx.conf配置文件,那么我们也可以复制一份nginx.conf文件,到其他位置,或者改名字(假设为【d:\pbi.conf】)。

修改完毕后,我们启动nginx,这样stream反向代理就架设成功了。(如果使用了非默认的配置文件名和文件位置,那么我们在启动nginx的时候就需要通过添加参数来特别指定要使用的配置文件)我们可以通过excel来进行测试~(方法不再赘述)

第四步,如果我们想要其他电脑访问(废话),那么我们还需要进行防火墙设置。打开windows高级防火墙,在入站规则中,放行我们的反向代理端口(示例中为6666端口)。

(由于阁主也是刚刚接触PBI,所以上述说法也是听来转述的,可能有偏颇甚至错误的时候,如果您发现文章有误,还请您直指不足,不吝赐教^_^)

分类
BI/PBI/PY学习交流 每日技巧

PBI学习——每日技巧20200828

潘淳老师:如何在PQ中一次性调出所有M函数(并取得帮助)?

不废话:#shared

详细步骤:

1)打开Excel

2)数据–>获取数据–>启动PQ

3)进入PQ Edit

4)主页–>新建源–>其它源–>空查询

5)公式栏输入:= #shared

6)点开任意函数,得到帮助

Tips-20200828OVER

阁主提示:点击一下【到表中】,查找更方便哦

对PBI、BI、PY感兴趣的童鞋们可以加我们的QQ群,后续有精彩课程大餐等您哦。

点击链接加入群聊【BI/PBI/PY学习交流群】

群号:874452276

分类
未分类

【推介】——excel技术交流群

群号:1039265912
点击链接加入群聊【Excel技术交流群】:https://jq.qq.com/?_wv=1027&k=54heh7g

2020年初,无情的2019-nCoV冠状病毒裹挟着恐慌、焦虑,趁着春运,在中华大地肆虐。家在河南的阁主,也因为疫情防控的原因,蛰居在家。每日在节节攀升的确诊人数、余音绕梁的防疫广播、唇枪舌剑的微博喧嚣中度过。

鉴于疫情防控的严峻形势,阁主供职的公司从公司实际、地方政府要求和员工实际情况出发,要求阁主居家办公,暂不返岗。

暂时不能够回到工作岗位,那么总要做点什么,正巧赶上阁主长期活跃的两个Excel技术交流群管理方因为某些原因,禁止了群友的自由交流,于是,阁主就建立了上面这个excel技术交流群。

这个群,为的是技术交流。这个群,不卖书,不卖课程。希望的,只是群友之间,互帮互助,共同提高。

我们要对知识报以尊重

小到我们个人,大到我们国家,乃至世界,只有对知识体现出足够的尊重,养成为知识付费的习惯,才能更好的往前发展。

我们要对自己报以尊重

这个群,鼓励技术交流,自主学习,崇尚开放的技术交流,崇尚分享自己的心得体会。

这个群,不鼓励那些遇到问题,不去搜索,不去探索,不去尝试,只伸手索取的行为。

对自己尊重,就是要相信自己,能学会,能学好,对自己有信心。遇到问题,我们首先要分析问题,知道问题的核心是什么,如何分解问题,如何查找解决方案,如何评价解决方案,如何对解决方案进行验证。

我们要对他人报以尊重

人生在世,每个人都是一个独立的个体。我们要尊重他人的劳动,尊重他人的习惯。如果,你遇到一个问题,不去思考,不去探索,不去尝试,而是无脑的向他人寻求帮助,这就是不尊重他人的劳动,也不珍惜他人的时间。

建群的目的,是为了交流,当然,群里并不仅限于Excel,Office系列其他软件,计算机基础知识,机械基础知识以及职场文化交流等等也都可以放开讨论。

最后,如果您有兴趣,可以点击顶部链接,加入阁主的Excel技术交流群,让我们共同进步,共同提升。欢迎您的加入。

分类
VBA

VBA应用——合并文件

日常工作中,我们有时候会需要将多份相同格式的工作簿合并到一个工作表中,进行数据分析和处理.

这时候,如果你一个个的打开粘贴,是非常耗时和耗费精力的.而且手工操作,免不了偶尔出个错,到了最后发现数据不对,一条条核对时候,就会在想,有没有什么操作,可以让你的双手解放一些呢?答案就是VBA.

下面一份代码,就是阁主写来合并多个工作簿的.现在放出来,以飨读者.

疏漏之处,还请包涵~

有问题欢迎指出,至于改不改嘛~看我心情.

Sub 合并文件()
    '注意,合并多个工作簿到当前激活工作簿的激活工作表,而不是代码所在工作簿
    '副作用:本代码有两项副作用,1是会取消所有的合并单元格,2是会取消所有的筛选,使用前,请确认是否可以接受.(可以放心的是,数据源工作簿并不会发生改变)
    Dim actWb As Workbook, actSh As Worksheet
    Set actWb = ActiveWorkbook
    Set actSh = ActiveSheet
    With Application.FileDialog(msoFileDialogFilePicker)
        If .Show = True Then
            Dim arrs
            Set arrs = .SelectedItems
        End If
        
    End With
    Dim s
    For Each s In arrs
        Dim obj
        Set obj = GetObject(s)
        Dim Sh As Worksheet
        For Each Sh In obj.Sheets
            '这里会遍历工作簿的所有的工作表,如果只需要遍历指定的工作表,请添加if条件
            'if sh.name="Sheet1" then
            Sh.Cells.UnMerge
            On Error Resume Next
            Sh.Cells.AutoFilter
            Sh.UsedRange.Copy actSh.Range("a1").Offset(actSh.UsedRange.Rows.Count + actSh.UsedRange.Row - 1, 0)
            If Err.Number <> 0 Then
                Debug.Print Err.Description & vbCrLf & Sh.Parent.Name & vbTab & Sh.Name
            End If
            On Error GoTo 0
            'end if
        Next
        obj.Close (False)
        Set obj = Nothing
        Set Sh = Nothing
    Next
End Sub

 

分类
VBA

VBA应用——遍历文件夹及其子文件夹

经常使用excel来进行数据统计和汇总分析的我们有时候需要将很多年份的数据进行汇总,如果我们使用VBA来帮助我们汇总,将会节约我们很多的时间。

如果需要汇总的文件都在一个文件夹中而不存在子文件夹,我们可以在网上找到很多简单的代码,告诉我们用VBA提供的Dir函数来获取文件列表。但如果我们需要汇总的文件有一些在子文件夹中,我们使用Dir来获取文件列表的方法就不太好用了。

怎么办呢?

下面,阁主呈上一份能够遍历文件夹及子文件夹获取文件列表的代码,以飨读者。

Function getFileList(Optional ByVal dirStr As String) As Collection
    Dim tmpStr As String, fileCollection As Collection '定义一个集合,来存放Dir出来的文件或文件夹名称
    '如果路径不带“\”,则加上
    If Right(dirStr, 1) <> "\" Then
        dirStr = dirStr & "\"
    End If
    '第一次Dir,遍历目录,并将文件或文件夹名称存入集合
    on error Resume next
    tmpStr = Dir(dirStr, vbDirectory)
    If Err.Number <> 0 Then
        Set getFileList = Nothing
        Exit Function
    End If
    on error goto 0
    Set fileCollection = New Collection
    While (tmpStr <> "")
        If tmpStr <> "." And tmpStr <> ".." Then
            fileCollection.Add (dirStr & tmpStr)
        End If
        tmpStr = Dir
    Wend
    '针对上述遍历出的文件或文件夹名称,递归遍历子目录
    Dim i
    i = 1
    While i <= fileCollection.Count
    '遍历刚才获取到的目录内文件夹和文件列表,递归调用本函数实现对子目录的遍历。
        On Error Resume Next
        Dim tmparr
        If fileCollection.Item(i) <> dirStr & "" And fileCollection.Item(i) <> dirStr & "." And fileCollection.Item(i) <> dirStr & ".." Then
            Set tmparr = getFileList(fileCollection.Item(i)) '递归调用,下一层目录
            If Err.Number = 0 Then
                
                Dim k, l
                l = i
                For k = 1 To tmparr.Count
                    fileCollection.Add tmparr(k), after:=l
                    l = l + 1
                Next k
                i = l
            Else
                Err.Clear
            End If
        End If
        On Error GoTo 0
        i = i + 1
    Wend
    Set getFileList = fileCollection
End Function

食用方法:

函数返回了一个Collection对象,可以通过遍历Collection对象的值来获得目录和文件列表。

Sub test()
    Dim s
    Set s = getFileList("d:\xx文件夹")
    Dim k
    For Each k In s
        Debug.Print k
    Next k
End Sub

 

分类
杂谈

杂谈——高考志愿填报分析

2015年,阁主的表妹高中毕业。家长打电话来说,看看能否给表妹一些报考的建议。

阁主思来想去,也没有什么特别好的渠道来了解这些学校。本来想着看看网上有没有适合的网站提供一些有价值的信息,结果发现然并卵。各个网站上,所提供的志愿参考,都是基于过去年份的分数来推荐的。那么,在分数线发生变化的情况下,给出的参考价值能有多大,阁主心里打了个不小的问号。

阁主了解到,2015年,河南省已经是出分后报志愿,并且是平行志愿。在收集信息的过程中,阁主也了解了下志愿投档的规则。

首先,将全省所有的考生(当然,分文理科)进行排序(首先比较总分,总分相同的话,比较语文、总分和语文相同的话,比较数学,如果前面三项都相同,就比较英语听力)。然后,按照排名顺序的先后,对每个考试依次按照志愿顺序进行投档。

这样以来,高考志愿填报的大小年情况就会小很多。由此,阁主便有了根据排名顺序,来进行一个录取可能性预测的分析。阁主认为,几十万人的独立决策,其结果应该是符合统计规律的。然后,阁主就收集了从2012年到2014年,三年间河南省理科类高考考生的分数段数据,和各个一本高校的投档线数据。这里需要说明为什么使用投档线数据,因为阁主找不到录取分数线数据,只能找到投档线的数据,而一般来说,投档后,接受专业调剂,被退档的可能性较小。

阁主对分数段数据和高校投档线数据进行统计分析后发现,虽然每年各个高校的录取分数都会发生变化,但是最低投档线考生的分数在全省学生中的排名比例基本是一致的。

由此,阁主认为,可以通过高考成绩在全省考生中所占的比例,来大致预估考生相匹配的学校范围。于是,阁主就出炉了第一版的河南省高考志愿填报参考。并发布在百度文库上,希望能够帮到需要进行志愿填报的莘莘学子。

其后2016、2017、2018年,阁主每年都会对这个参考进行更新,并发布在百度文库上。2018年,阁主对志愿填报参考进行了界面优化,实现了输入分数,自动生成内部跳转链接的功能,做了一些基本的说明。

2019年,阁主的侄女在河北省参加高考。于是,阁主又收集了从2012年到2018年的河北省理工科分数段数据和投档分数线数据,并进行数据分析和汇总。

近年来,由于百度文库的日益壮大,以及有关部门对共享文档方面的要求加严。百度文库的上传、审核效率和体验有明显下降。2018年,阁主在获取到分数段数据后的第一时间就进行了文件更新和上传工作,但由于审核速度和准确性的限制,导致文件在公众面前面世的时候,本科一批的志愿填报工作基本上处于尾声了。

为了避免2019年再次出现这种情况,阁主决定提前上传文件和审核。但是这中间有一个矛盾:阁主的志愿填报参考,最重要的一环,是需要获取考生的排名占比情况,但是提前上传文件,没办法在里面添加排名占比计算表。于是,阁主在最新版本的高考志愿填报参考中,使用了excel2013开始提供的webservice函数。webservice函数能够通过访问指定网址获取数据。于是阁主自己架设服务端,在线提供排位数据。所好的是,阁主的个人博客使用的是独立主机,可以相对自由的架设服务。而对于不能使用webservice函数的情况(比如excel版本过低等),也会在相应位置提供一个超链接,并引导使用者使用浏览器访问的方式获取占比数据。

文末附上2019年河南、河北两省的高考本科一批理工科志愿填报参考以飨读者。

2019年河南省理工一本志愿填报参考  2019年河北省理科一本志愿填报参考

 

分类
未分类

Excel应用——2019年河北省理科一本志愿填报参考

1、本文件数据全部来自于官方公开渠道

2、本文件汇集了从2012年开始,到2018年间河北省理科计分人数统计数据,并计算出排位占比。

3、本文件汇集了从2012年开始,到2018年间河北省理科一本投档线统计数据(分院校),并计算出该投档线排位占比。

4、本文件制作了2012-2018年全部一本院校排位占比图,并按照加权平均排位占比,对院校按顺序排列,方便选取心仪的学校。

5、本文件《2012-2018年全部一本院校排位占比图》中,波动程度指各院校最低投档线排位占比波动程度,数据越小,波动程度越低。闯一闯的可能性也越低。

6、本文件《2012-2018年全部一本院校排位占比图》中,相对波动程度指各院校排位占比波动程度相对最大波动程度院校的比值。

7、数据是冰冷的,无情,但是揭示了一般规律。

8、本文件所有内容均为基于过往数据进行计算,不对任何趋势做任何预测。

9、希望每个河北考生都能够进入自己心仪的学校。但本人无法对结果做任何预测和保证。

使用方法:

1、根据提示,启用webservice函数(重要,启用以使用自动查询排位占比功能)

2、输入您的高考分数

3、获取得分排位占比(若webservice函数不能使用,请复制黄色区域中网址到浏览器访问,并将返回数据填入黄色区域;填入数据后,自动获取排位占比功能将失效)

4、根据得分排位占比,在《2018全部一本院校占比图》中选择合适的学校(右上侧灰色区域有超链接,可以快速直达相应的占比位置)

5、根据阅卷情况,占比查找功能约在6月24日前后开放,在此之前,为2018年占比数据,仅供参考。

技术支持:淬剑阁

2019年河北省理工一本志愿填报参考