LIVAC共時語料庫簡介

screenshot

中心消息

LIVAC漢語共時語料庫(Linguistic Variation in Chinese Speech Communities)與眾不同,因為它以嚴緊、恆常與「共時」方式,搜索和處理了超常的大量漢語具代表性報章語料,並通過精密的技術,累積了泛華語地區眾多精確的統計數據。本語料庫最大特點是採用「共時性」視窗模式,剖析來自香港、北京、上海、台灣、澳門、星加坡等多地的定量華語媒體語料。直至2020,LIVAC已處理逾7.0億字,累積並持續提煉出二百多萬詞條。LIVAC所收集各地語用數據,可供各種比較研究,並方便有關的信息科技發展與應用。此外,語料庫又兼顧了「歷時性」,方便各方人士以專詞搜索(KWIC),以便客觀地觀察與研究18年視窗內的有代表性的語用發展全面動態。經過協調與配合個別客戶需求,例如針對性以地區、時段或範疇,LIVAC曾為多個公私營機構提供服務,包括語言工程,資訊服務,詞典編著,媒體分析與教育方面機構等。LIVAC由香港城市大學語言資訊科學研究中心開發和推展,由城大企業有限公司旗下麒麟(香港)有限公司提供技術支援。2010年至2013年期間,LIVAC由香港教育學院語言資訊科學研究中心維持。自2013年7月起,LIVAC由麒麟(香港)有限公司獨家維護和開發。(更多背景信息)

另見維基百科的英文參考資料: https://en.wikipedia.org/wiki/LIVAC_Synchronous_Corpus

本語料庫暫提供1995至1997年的語料,歡迎首次使用者試用。
如需更多年份資料,請聯繫我們@ http://www.chilin.hk