
A股上市公司公告信息抽取
大賽背景
在金融領域,每24小時都會產(chǎn)生大約2.5億字節(jié)的數(shù)據(jù),早已超過人腦處理的極限,面對全球百萬億美元的資產(chǎn)管理規(guī)模,行業(yè)迫切需要人工智能的加入,提升行業(yè)運行效率,讓投資變得更加智能。
“FDDC2018金融算法挑戰(zhàn)賽”是全球首場專注金融領域,深入投資實戰(zhàn)的技術大賽,本場大賽將提供海量金融數(shù)據(jù)、真實業(yè)務場景,世界級AI及金融導師指導,面向全球征集金融及算法精英,以科技摘取投資圣杯。
開始比拼前,比賽攻略走一波?
快捷通道
FDDC2018金融算法挑戰(zhàn)賽01-A股上市公司季度營收預測 賽題報名入口-立即進入
賽題描述
在投資研究過程中,上市公司公告是投資者的重要參考材料,挖掘公告重要信息是研究員每日的必要功課,但海量公告卻令人腦難以負荷。我們將嘗試讓機器根據(jù)需求,自動抽取結(jié)構(gòu)化數(shù)據(jù),幫助研究員快速獲取投資線索。
賽程安排
本次大賽分為初賽、復賽和決賽三個階段,報名截止時間為7月8日12:00;具體安排和要求如下:
初賽(5月18日-7月10日,UTC+8)
1、報名成功后,參賽隊伍通過天池平臺下載數(shù)據(jù),本地調(diào)試算法,在線提交結(jié)果。若參賽隊伍在一天內(nèi)多次提交結(jié)果,新結(jié)果版本將覆蓋舊版本。
2、比賽題目設定為對“股東增減持”、“重大合同”和“定向增發(fā)”3個類型的公告進行信息抽取,主辦方將提供標準訓練數(shù)據(jù)集(包括公告原文和對應的結(jié)構(gòu)化數(shù)據(jù)),供參賽選手訓練算法模型;提供標準測試數(shù)據(jù)集A(無標注),供參賽選手提交評測結(jié)果并參與排名。參賽隊不可以使用自有數(shù)據(jù)。初賽成績以參賽隊伍在第二階段測試數(shù)據(jù)集上的評測結(jié)果為準,計算抽取準召率,按評判標準從高到低排序,篩選出進入復賽的隊伍。
3、初賽一階段:5月18日12:00-7月8日12:00,參賽隊伍提交結(jié)果,從6月1日8日起,系統(tǒng)每天進行1次評測和排名,評測時間為當天12:00,按照評測指標從高到低進行排序,更新排行榜。
4、初賽二階段:7月8日13:00-7月10日12:00,系統(tǒng)將在7月8日13:00更換測試數(shù)據(jù)B,參賽隊伍需再次下載數(shù)據(jù)文件,生成并提交測試結(jié)果。系統(tǒng)將于7月9日12:00與7月10日12:00進行評測,并取最優(yōu)成績進行排名,更新排行榜。
5、代碼審核階段:7月10日12:00-7月12日12:00。TOP120的團隊需提交代碼審核,組委會將識別并剔除只靠人工打分而沒有算法貢獻的隊伍,初賽成績符合要求且通過支付寶實名認證的TOP100參賽隊伍將進入復賽。(認證入口:天池網(wǎng)站-個人中心-認證-支付寶實名認證,要求在7月12日12:00 前完成認證)
復賽(7月13日-8月23日 ,UTC+8 )
1、7月 13日12:00發(fā)布復賽數(shù)據(jù)集,其中會更換若干公告類型。
2、復賽一階段:7月13日12:00-8月8日22:00,參賽隊伍下載數(shù)據(jù)集,在本地開發(fā)程序,提交程序到天池平臺調(diào)試運行,8月8日22:00之后,不可再修改程序,該程序在平臺上運行生成的預測結(jié)果,將作為復賽的主要評分依據(jù)。未能成功運行程序的參賽隊,視作棄權。(平臺環(huán)境為 ECS 64位的CentOS 7.4操作系統(tǒng),開發(fā)代碼支持python3.6)
3、復賽二階段:8月9日-8月22日期間,組委會以第二階段新發(fā)布的上市公司公告為測試數(shù)據(jù),由平臺統(tǒng)一運行參賽者提交的程序,根據(jù)程序執(zhí)行結(jié)果,系統(tǒng)將于8月23日12:00進行最終評測,評測結(jié)果將按照評測指標從高到底進行排序,更新排行榜。該階段截止時,要求TOP10團隊提交代碼審核。復賽代碼審核通過的排名前5名的參賽隊伍選手代表將受邀參加決賽。
決賽(8月29日-8月30日 ,UTC+8 )
1、決賽將以現(xiàn)場答辯會的形式進行,晉級決賽團隊需提前準備答辯材料,包括答辯PPT、參賽總結(jié)、算法核心代碼。
2、由組委會承擔差旅入圍決賽隊伍的差旅費用。具體安排另行通知。
3、答辯現(xiàn)場,每支隊伍面對評委有15分鐘的陳述時間和10分鐘的問答時間。評委將根據(jù)選手的技術思路、理論深度和現(xiàn)場表現(xiàn)進行綜合評分。
4、決賽分數(shù)將根據(jù)參賽隊伍的算法成績和答辯成績加權得出。評分權重:復賽得分70%,決賽答辯30%。依據(jù)決賽分數(shù)評選出大賽獎項并舉行隆重頒獎。
參賽條件
1、參賽隊伍不允許使用外部數(shù)據(jù),若有違反直接取消參賽資格;
2、在校學生、公司員工、高等院?;蚩蒲袉挝谎芯咳藛T,均可以個人身份或自組團隊參賽(為保證公平,請勿以公司名義參賽或在團隊命名中透露公司名稱),不限年齡、國籍、背景,組隊上限5人;
3、大賽組織機構(gòu)單位中涉及題目編寫、數(shù)據(jù)接觸的人員禁止參賽;大賽組織機構(gòu)其余員工參賽,可參與排名,但不參與評獎及領取獎金;
4、大賽官方交流請至技術圈,選手交流釘釘群掃描以下二維碼:

獎項設置
冠軍:1支隊伍,獎金25萬人民幣,頒發(fā)獲獎證書
亞軍:1支隊伍,獎金10萬人民幣,頒發(fā)獲獎證書
亞軍:1支隊伍,獎金5萬人民幣,頒發(fā)獲獎證書
最具創(chuàng)新極客:1支隊伍,獎金1萬人民幣,頒發(fā)獲獎證書
最具潛力極客:1支隊伍,獎金1萬人民幣,頒發(fā)獲獎證書
入圍決賽隊伍還將受邀參加主辦單位深度交流會,有機會獲得頂尖金融及科技公司高管直聘機會。
舉辦單位
中國證券投資基金業(yè)協(xié)會、華夏基金、易方達、通聯(lián)數(shù)據(jù)、阿里云