内容
-
states_all.csv:主数据文件。包含来自一个CSV中所有州级来源的聚合。
-
states_all_extended.csv:states_all.csv的扩展版本; 包含有关种族和性别的详细注册数据。
-
aggregates.zip
-
naep_states.csv:国家教育进展评估(NAEP)的综合结果。
-
finance_states.csv:各州的汇总财务数据。
-
finance_districts.csv:学区的综合财务数据。
-
enroll_states.csv:状态的聚合注册数据。
-
-
elsect.zip,NDE.zip,nces_enroll.zip:用于创建聚合的源文件。
-
sanity_check.txt:一个自动生成的文件,用于报告states_all.csv中的空值。
-
enroll_sanity_check.txt:一个自动生成的文件,用于报告在注册数据中找到的空值。
列分解
鉴定- PRIMARY_KEY:年份和州名称的组合。
- 年
- 州
按学年入学的学生数量细分。
-
GRADES_PK:幼儿园前教育的学生人数。
-
GRADES_4:四年级学生人数。
-
GRADES_8:八年级学生人数。
-
GRADES_12:十二年级的学生人数。
-
GRADES_1_8:一年级到八年级的学生人数。
-
等级9_12:九年级到十二年级的学生人数。
-
GRADES_KG_12:幼儿园到十二年级的学生人数。
-
GRADES_ALL:州内所有学生的人数。与财务数据中的ENROLL相当(这是美国人口普查局对该州学生的估计)。
states_all的扩展版本包含按种族和性别细分注册的其他列。例如:
-
Grades_ALL_AS:种族被归类为“亚洲人”的学生人数。
-
Grades_ALL_ASM:种族被归类为“亚洲人”的男学生人数。
-
Grades_ALL_ASF:种族被归类为“亚洲人”的女学生人数。
代表的种族包括AM(美洲印第安人或阿拉斯加原住民),AS(亚洲人),HI(西班牙裔/拉丁裔),BL(黑人或非裔美国人),WH(白人),HP(夏威夷原住民/太平洋岛民)和TR(两场或更多场比赛)。代表性别包括M(男性)和F(女性)。
金融按收入和支出细分各州。
-
ENROLL:美国人口普查局对该州学生的统计。应与GRADES_ALL相当(这是NCES对该州学生的估计)。
-
总收入:州的总收入。
- FEDERAL_REVENUE
- STATE_REVENUE
- LOCAL_REVENUE
-
TOTAL_EXPENDITURE:州的总支出。
- INSTRUCTION_EXPENDITURE
- SUPPORT_SERVICES_EXPENDITURE
- CAPITAL_OUTLAY_EXPENDITURE
- OTHER_EXPENDITURE
通过相应考试(数学和阅读,4年级和8年级)评估的学生表现细分。
-
AVG_MATH_4_SCORE:该州四年级学生参加NAEP数学考试的平均分。
-
AVG_MATH_8_SCORE:州八年级学生参加NAEP数学考试的平均分。
-
AVG_READING_4_SCORE:该州四年级学生参加NAEP阅读考试的平均分。
-
AVG_READING_8_SCORE:该州八年级学生参加NAEP阅读考试的平均分。
数据处理
原始资料来源可以在这里找到:
#Incrollment https://nces.ed.gov/ccd/stnfis.asp # 金融 https://www.census.gov/programs-surveys/school-finances/data/tables.html # 学术成就 https://www.nationsreportcard.gov/ndecore/xplore/NDE
方法说明
-
修改了2014年,2011年,2010年和2009年NCES注册数据的电子表格,以便将关键数据放在同一张纸上,从而使脚本编写变得更加容易。
-
“ENROLL”列表示美国人口普查局的数据值(财务数据),而“GRADES_ALL”列表示NCES数据值(人口统计数据)。虽然这两个组织在这个问题上是对应的,但这些值(表面上看是相同的)确实有所不同。他们的文件将这归结为成员的差异(即什么是和不是四年级的学生)。
-
NCES的入学数据在调查年份发生了一些变化。其中一个值得注意的是,学生性别数据似乎直到2009年才收集.s态_all_extended.csv中的信息反映了这一点。
-
NAEP测试分数数据仅适用于特定年份
-
该数据的当前版本与状态级模式有关。作者希望未来版本允许学区级别的粒度。