课程格子如何收集全国所有高校的课程数据?
1个回答
展开全部
几个同学回答的都挺好的,只是做的过程并没有看上去那么难:
1、教务系统接入,同步导出个人课表。我们并没有一开始就做这个功能,而是等到有了百万用户和很多热心粉丝之后才开始做这个功能。我们从我们的校园大使、热心用户那里收集到了1000所大学的教务地址、学生学号和密码。然后分析了一下学校教务的账号结构。清华的那个同学说的很对,每个学校的结构都不一样,如果不更多的依靠技术,无疑是一件费时费力的事情。我们也想过雇佣几十个实习生,一个一个学校做。但觉得这个方法效率太低,可维护性太差,也不符合我们团队的风格。
我自己搭建了一套系统,自动排查,迅速筛掉不可以做导入的学校,这些学校包括:屏蔽外网的、教务没有课表的等等;然后是全自动的测试系统,用登录结果跟已知算法匹配。最后是输出调整,根据输出进行语义分析的调整。搭建整个系统用了一周,这一周正好收集到了账号,然后在接下来的一周我们就解决了500所高校的导入问题。不过还是会有局限,这个工作不可能覆盖全部的高校,所以注定更多的高校是没有办法连通教务导入课表的。
其实最让我们意外的是用户产生数据的积极性,超过了我们的预期,用户贡献内容比例非常高。随着数据生成的方式多样化和已有数据积累,也许以后我们能做到课程数据的零输入。
总体来说,这是一个复杂但有挑战的技术问题。我们也没有百分之百解决。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询