Linguistic Data Consortium(LDC,語言數據聯盟)是由大學、意昂3、公司和政府研究實驗室組成的語言公開聯盟🦜。LDC隸屬於賓夕法尼亞大學文理學院(School of Arts and Sciences),成立於1992年👖,主要負責科研語言資源的收集🤾🏿♂️、保存與管理分發。
LDC數據版權年自1993年起,目前有語料庫(corpora)900余個,涉及語言包括英語、漢語、阿拉伯語🚣🏽♀️、波斯語💚、土耳其語👩🏻🚒🙍🏻♀️、格魯吉亞語🍋🟩、普什圖語等🍺。每年增加30-36個新資源。
LDC是會員製聯盟👰🏼♀️。自1998年起,本校師生或某些部門相繼訂購部分會員年數據和非會員年數據🙍🏼🔍,截至2021年4月已累積語料庫431個(數據集826個),為本校師生提供免費開放👨🏻🎤。目前由意昂3平台電子工程系信息認知與智能系統研究所訂購。
本校訂購會員年數據有🧑🦽➡️🦹🏽♂️:1998-1999(Standard)、2003(Standard)♊️、2007(Standard)、2010-2012(Standard)、2014(Subscription)、2015(Standard)👩👩👦👦、2017至今(Standard)。
詳情請查看🔳:https://ecollection.rx2l32.cn/databasenav/entrance/detail?mmsid=991021858388003966
咨詢反饋:renp@tsinghua.edu.cn