网易教育讯 2015年1月14日《2014新东方雅思年度报告》正式发布。
大数据助力美本留学
美本 谢欣燕
我们所处的是一个大数据时代,数据价值体现在生活的方方面面。在这样的形式下,美本业务的数据分析显得格外重要。
我们对全国近40家分公司进行全面数据收集后,得到16,013条有效原始数据,形成《2014美本录取数据》。表头分析维度为:学生姓名、服务类型、服务类型、前期顾问、后期顾问、文书顾问、入学时间、申请类型、TOEFL、SAT1、SAT2、AP、分公司所在地、高中学校名称、GPA、申请学校名称、申请专业、申请类型(ED/EA/RD)、录取结果、奖学金、分校区、学校排名、学校类型。
根据原始数据《2014 美本录取数据》,我们分析得到《2014 美本全国申请结果数据统计分析》。
1. 2014年前途申请人数最多的10所学校:(UC六所算一所,亮黄色所示)
以上学校特征:
a. 除波士顿大学外,清一色公立大学;
b. 基本都是美国各大州州立;追溯原因:美国公立立学校财政不独立,受州政府管辖,因而收多少学生,收什么样的学生也就不是自己能说了算。这样一来,公立学院往往录取的标准比较低,录取率也就比私立大学高。
c. 排名比较集中,近半数学校围绕在Rank 40;
d. UC系统的基本都有了(图中亮黄色突出标示);
e. 学校都很大。
2. 2014年前途录取率最高的20所学校
统计口径:
a.申请人数在150人以上,已排除申请人数太少的学校;
b.排名在80名以前的学校纳入统计;
c. UC六所算一所,亮黄色所示;
与去年相比,加州学校整体录取率降低,没有一所进入录取率排名前十。可能与加州排华法案有关。一些学员在收到加州拒信后,还以加州排华法案为由,进行了进一步争取,以获得offer。
比较上述两个表格:
“前途录取率最高的10所大学”与“前途申请最多的20所大学”有10所重叠,追溯原因:在咨询顾问的引导下,前途的孩子对自身有比较理性的定位,选校有着较高的录取命中率。
3. 通过大数据分析,我们能准确定位客户的目标学校,助力获得最佳 offer(以深受中国孩子喜爱的美国加州洛杉矶分校为例)
数据分析
a. 2300+档录取的7个孩子,GPA都高于3.7(除了未知GPA);未能录取的总共4人,其中3人被拒,1人等待;
b. 2200+档录取学生里,GPA都高于3.7(除了未知GPA);被拒11人,8人GPA在3.7以上;其他3人GPA分别为3.6、3.3、3.3。等待1人,GPA为4.0,TOEFL为108;
c. 2100+档29人录取,有2人GPA低于3.7,分别为3.6、3.5;
d. 2000+档6人录取,GPA都高于3.7(除了未知GPA);
e. 1900+档录取1人,GPA3.7,TOEFL 105;
f. 1800+档录取1人,GPA3.5,TOEFL 94;
g. 录取UCLA最低分的孩子SAT是1500,GPA3.3,TOEFL 101。
4. 受中国留学生欢迎的典型学校分析
University of California-Berkeley
SAT
录取人数
备注:
a. 所有录取学生里,只有2人GPA低于3.7,分别都是3.3;
b.2300+档学生10录3,与2013年相比录取率明显降低(2013年:2300+档学生4录3)。
Penn State University
SAT
录取人数
备注:
a. 无法区分录取的是主校区还是分校,无法排除“主校不录,建议分校的情况”;
b. 高分档学生情况如下:
2300+区间没有录取的孩子有1个,其中1个显示被拒,被拒这孩子是重庆八中的,TOEFL 114,GPA未知,申请的是ED1;
2200+区间没有录取的孩子有3个,其中2个显示被拒,被拒这孩子是广东实验中学和The Newman School的;
2100+区间没有录取的孩子有6个,其中3个显示被拒,2人GPA低于3.7,分别为3.4和3.5,另1个人GPA刚好为3.7。
University of California San Diego
SAT
备注:
a. 2300+档有1个学生显示没有被录取,是在waitlist上,不是被拒;
b. 2200+档有3个学生显示没有被录取,其中2人被拒,GPA分别为3.3和3.6,另一个人结果为other,GPA为3.6;所有此档被录取的学生,GPA均在3.7以上;
c. 2100+档学生被拒4个,GPA均低于3.7;有两个GPA分别为3.00和3.30的孩子,被录取,分别是本一,北京101中学,申请专业undecided,TOEFL 109; 宁波,Lancaster Catholic High School,申请专业Engineering,TOEFL 107;
d. 2000+档学生被拒30个,10人GPA高于3.7;录取72人,13人GPA低于90;
e. SAT低于1800的学生,录取的有2个,GPA一个3.7,一个3.8;TOEFL分别为85,84;申请的专业分别为Math和Econ;都是合肥分公司的;都申请的是RD;
f. 不知SAT的孩子有1个录取,GPA91。
5. 总结
大数据帮助我们准确定位客户的目标学校,助力获得最佳offer。
大数据帮助我们总结经验,我们可以很便捷地分析位于统计分布尾端的成功案例以及失败教训。
根据IELTS、TOEFL、SAT,GPA和各个学校的典型性分析,学生可以根据大数据,准确定位需要达到的IELTS、TOEFL、SAT、GPA等标准化考试分数。
展望2015年,前途公司的未来数据收集将有改进:
数据收集将与“报完成”联系:数据收集器直接从CRM后台获取最准确的数据——只有数据收集器获得准确完备的数据后,系统方可放行报完成。
用身份证号与学生姓名关联:第二代居民身份证号码中,前1、2位数字表示:所在省份的代码;第3、4位数字表示:所在城市的代码;第5、6位数字表示:所在区县的代码;第7~14位数字表示:出生年、月、日;第15、16位数字表示:所在地的派出所的代码;第17位数字表示性别:奇数表示男性,偶数表示女性。
我们将更准确地通过大数据抓住学生的特质与大学录取的关联,得到更多有趣的结论,例如:大数据表明成功申请出国的12星座中天蝎座最多。