一、總貌
2009年的中國(guó)語(yǔ)言生活,呈現(xiàn)出和諧有序、健康穩(wěn)健、生機(jī)勃勃的發(fā)展態(tài)勢(shì)。語(yǔ)言文字工作亮點(diǎn)突出,成效顯著,引起社會(huì)廣泛關(guān)注。民族語(yǔ)文工作多方面開(kāi)展,新聞出版、廣播電視領(lǐng)域進(jìn)一步加強(qiáng)了對(duì)語(yǔ)言使用的管理,漢語(yǔ)國(guó)際傳播規(guī)模穩(wěn)步擴(kuò)大,海外華文教育迎來(lái)難得的發(fā)展機(jī)遇。年度語(yǔ)言熱點(diǎn)不斷涌現(xiàn),語(yǔ)言生活出現(xiàn)新領(lǐng)域和新動(dòng)向。
二、領(lǐng)域語(yǔ)言
(一)語(yǔ)言文字工作
語(yǔ)言文字應(yīng)用管理工作不斷拓展 截至2009年年底,城市語(yǔ)言文字工作評(píng)估通過(guò)認(rèn)定而達(dá)到標(biāo)準(zhǔn)的二類城市有32個(gè),一二類城市全部達(dá)標(biāo)的省份1個(gè),三類城市88個(gè)。已認(rèn)定的省、市級(jí)語(yǔ)言文字規(guī)范化示范學(xué)校累計(jì)近1.3萬(wàn)所,教育部、國(guó)家語(yǔ)委認(rèn)定的國(guó)家級(jí)語(yǔ)言文字規(guī)范化示范學(xué)校426所。開(kāi)展公務(wù)員普通話水平測(cè)試的城市173個(gè),開(kāi)展窗口行業(yè)普通話測(cè)試的城市達(dá)176個(gè)、219 607人次,參加漢字應(yīng)用水平試點(diǎn)測(cè)試的達(dá)25 577人,參加“中華誦·經(jīng)典誦讀”大賽的超過(guò)840余萬(wàn)人。教育部語(yǔ)言文字應(yīng)用管理司在全國(guó)8個(gè)?。ㄗ灾螀^(qū))共舉辦少數(shù)民族教師普通話培班11期,培訓(xùn)教師964人。
據(jù)國(guó)家語(yǔ)委組織的全國(guó)16個(gè)城市的外文使用情況調(diào)查數(shù)據(jù)顯示:全國(guó)外文平均使用率達(dá)31%,英語(yǔ)使用占全部外語(yǔ)語(yǔ)種的82.77%。
語(yǔ)言文字信息管理工作深入推進(jìn) 2009年發(fā)布了《漢字部首表》《GB13000.1字符集漢字部首歸部規(guī)范》《現(xiàn)代常用字部件及部件名稱規(guī)范》和《現(xiàn)代常用獨(dú)體字規(guī)范》4項(xiàng)國(guó)家語(yǔ)委規(guī)范;以《中國(guó)語(yǔ)言生活綠皮書》的形式,發(fā)布了6項(xiàng)規(guī)范草案。天津市語(yǔ)言文字培訓(xùn)測(cè)試中心受國(guó)家語(yǔ)委委托研制的“漢語(yǔ)口語(yǔ)水平測(cè)試(母語(yǔ)非漢語(yǔ))標(biāo)準(zhǔn)研究”項(xiàng)目,通過(guò)專家鑒定。
教育部、國(guó)家語(yǔ)委發(fā)布了2008年度中國(guó)語(yǔ)言生活狀況報(bào)告。與相關(guān)單位聯(lián)合發(fā)布了“2008年度中國(guó)主流媒體十大流行語(yǔ)”“2009年度中國(guó)主流媒體十大流行語(yǔ)”。國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心少數(shù)民族語(yǔ)言分中心的維吾爾語(yǔ)文研究基地和藏語(yǔ)文研究基地分別在西北民族大學(xué)和新疆師范大學(xué)成立。中國(guó)語(yǔ)言資源有聲數(shù)據(jù)庫(kù)建設(shè)江蘇省首批試點(diǎn)通過(guò)驗(yàn)收,第二批試點(diǎn)工作啟動(dòng);少數(shù)民族語(yǔ)言有聲數(shù)據(jù)庫(kù)建設(shè)試點(diǎn)工作在云南啟動(dòng)。中國(guó)語(yǔ)言資源有聲數(shù)據(jù)庫(kù)建設(shè)的技術(shù)規(guī)范、工作規(guī)范研制完成。
民族語(yǔ)文工作多方面開(kāi)展 2009年7月國(guó)務(wù)院發(fā)布了《國(guó)務(wù)院關(guān)于進(jìn)一步繁榮發(fā)展少數(shù)民族文化事業(yè)的若干意見(jiàn)》,其中四條與少數(shù)民族語(yǔ)言文字工作有關(guān)。在教育部語(yǔ)信司支持下,“全國(guó)彝語(yǔ)術(shù)語(yǔ)標(biāo)準(zhǔn)化工作委員會(huì)”11月在西南民族大學(xué)成立?!安?、維、彝民語(yǔ)語(yǔ)音參數(shù)數(shù)據(jù)庫(kù)”“漢藏語(yǔ)系語(yǔ)言詞匯語(yǔ)音數(shù)據(jù)庫(kù)”等多項(xiàng)教育部、國(guó)家語(yǔ)委民族語(yǔ)言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化項(xiàng)目結(jié)項(xiàng)。文化部全國(guó)文化信息資源建設(shè)管理中心2009年啟動(dòng)了康巴藏語(yǔ)節(jié)目的譯制工作。
新聞出版語(yǔ)文工作取得實(shí)效 據(jù)2009年的報(bào)告顯示,2008年度全國(guó)教育教學(xué)輔助類報(bào)紙編校質(zhì)量穩(wěn)步上升,全國(guó)行業(yè)報(bào)(部分)編校質(zhì)量普遍提高。
地方語(yǔ)言文字工作 為了迎接2010年上海世界博覽會(huì),上海市語(yǔ)言文字工作委員會(huì)、教育委員會(huì)、質(zhì)量技術(shù)監(jiān)督局于2009年制定了上海地方標(biāo)準(zhǔn)《公共場(chǎng)所英文譯寫規(guī)范》。上海市語(yǔ)委采取多種形式,在全市開(kāi)展公共場(chǎng)所英文使用規(guī)范化專項(xiàng)整治行動(dòng),取得了階段性成果。2009年,天津市語(yǔ)言文字培訓(xùn)測(cè)試中心受國(guó)家語(yǔ)委委托,在馬來(lái)西亞成功舉行了兩場(chǎng)普通話水平測(cè)試,引起了強(qiáng)烈反響。中華經(jīng)典誦讀基地在蘇州建立。朗誦水平等級(jí)考試在上海開(kāi)展。
(二)廣播電影電視及網(wǎng)絡(luò)語(yǔ)言
廣電總局出臺(tái)嚴(yán)格控制電視劇使用方言的新措施 針對(duì)我國(guó)電視劇大量使用方言的問(wèn)題,國(guó)家廣播電影電視總局辦公廳2009年7月下發(fā)了《關(guān)于嚴(yán)格控制電視劇使用方言的通知》。
網(wǎng)絡(luò)語(yǔ)言使用狀況調(diào)查 據(jù)2009年進(jìn)行的一項(xiàng)問(wèn)卷調(diào)查,經(jīng)常使用網(wǎng)絡(luò)語(yǔ)言的占樣本總數(shù)的31.3%,有時(shí)使用的占50.0%,很少使用的占15.6%,從來(lái)不用的占3.1%。
(三)語(yǔ)言教育與語(yǔ)言傳播
漢語(yǔ)國(guó)際傳播規(guī)模穩(wěn)步擴(kuò)大 2009年在全球金融危機(jī)背景下,漢語(yǔ)國(guó)際傳播仍穩(wěn)步發(fā)展。截至2009年12月,在88個(gè)國(guó)家開(kāi)設(shè)孔子學(xué)院282所、孔子課堂272個(gè),孔子學(xué)院專職兼職教職工約3 100人。中國(guó)向109個(gè)國(guó)家派出教師2 060名,向71個(gè)國(guó)家派出漢語(yǔ)志愿者教師2 740名,向104個(gè)國(guó)家2 500多所主流學(xué)校贈(zèng)送教材、圖書和音像資料315萬(wàn)冊(cè)。2009年中外雙方對(duì)孔子學(xué)院共投入資金1.19億美元。
海外華文教育的新機(jī)遇 隨著中國(guó)的崛起,華人在國(guó)際上的地位提高,許多國(guó)家政府部門開(kāi)始理解并支持華文教育。華人社會(huì)捐資助學(xué)、興辦華文教育的熱情空前高漲。2009年國(guó)務(wù)院僑務(wù)辦公室和中國(guó)海外交流協(xié)會(huì),將原來(lái)不定期召開(kāi)的國(guó)際華文教育研討會(huì)改為兩年一屆的世界華文教育大會(huì)。
三、新領(lǐng)域和新動(dòng)向
法庭審判中少數(shù)民族語(yǔ)言使用問(wèn)題 據(jù)內(nèi)蒙古自治區(qū)高級(jí)人民法院統(tǒng)計(jì),該自治區(qū)現(xiàn)有19個(gè)沿邊法院,25個(gè)牧區(qū)法院,轄區(qū)總?cè)丝?SPAN>608.3萬(wàn)人,占全區(qū)總?cè)丝诘?SPAN>26%,這些法院普遍缺少能夠使用少數(shù)民族語(yǔ)言主持訴訟活動(dòng)的審判人員。全區(qū)現(xiàn)有法官5600多人,蒙漢雙語(yǔ)兼通的法官僅有421人,占全部法官數(shù)的7.5%。雙語(yǔ)兼通的法官數(shù)量遠(yuǎn)遠(yuǎn)不能滿足民族地區(qū)雙語(yǔ)訴訟審判的需要。
語(yǔ)言信息產(chǎn)業(yè)中的喜與憂 喜:機(jī)器翻譯的發(fā)展推動(dòng)了多語(yǔ)言信息服務(wù)產(chǎn)業(yè)的發(fā)展。“面向奧運(yùn)的多語(yǔ)言智能信息服務(wù)網(wǎng)絡(luò)系統(tǒng)”成功為北京奧運(yùn)會(huì)提供了奧運(yùn)信息和城市信息的多語(yǔ)言服務(wù),還將在2010年上海世界博覽會(huì)以及今后各類大型國(guó)際體育文化商業(yè)交流活動(dòng)中提供多語(yǔ)言信息服務(wù)。憂:最近五六年,中國(guó)字庫(kù)產(chǎn)業(yè)急劇萎縮,字庫(kù)行業(yè)的很多優(yōu)秀人才紛紛改行。究其原因是為盜版所累。
手語(yǔ)使用及相關(guān)問(wèn)題 在文化、醫(yī)療、社會(huì)保障、體育、商業(yè)、社會(huì)服務(wù)等各個(gè)行業(yè),由于缺乏手語(yǔ)翻譯人員,聽(tīng)障人士難以與外界進(jìn)行有效溝通。我國(guó)現(xiàn)有的手語(yǔ)翻譯基本都是由聾校老師和殘聯(lián)工作人員兼職承擔(dān),遠(yuǎn)遠(yuǎn)滿足不了2 000多萬(wàn)聾人的需求。
四、報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)語(yǔ)言文字使用的若干數(shù)據(jù)
報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)的年度用字用語(yǔ)狀況,可以反映媒體年度的語(yǔ)言使用實(shí)態(tài),也可以透過(guò)這些字詞語(yǔ)的使用狀況看到年度的社會(huì)熱點(diǎn)、重大事件等。2009年度的用字用語(yǔ)調(diào)查是在國(guó)家語(yǔ)言資源監(jiān)測(cè)語(yǔ)料庫(kù)2009年度的語(yǔ)料上進(jìn)行的,語(yǔ)料涵蓋平面媒體、有聲媒體、網(wǎng)絡(luò)媒體(新聞)三種,共計(jì)1 249 387個(gè)文本文件, 1 007 019 960字次。
今年適逢年度《中國(guó)語(yǔ)言生活狀況報(bào)告》發(fā)布五周年,國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心特意對(duì)2005-2009年度的用字用語(yǔ)進(jìn)行了比較。歷時(shí)五年的語(yǔ)料積累,既可以用來(lái)反映五年共時(shí)的語(yǔ)言生活,也可以通過(guò)對(duì)比分析來(lái)反映五年歷時(shí)的語(yǔ)言變化。今年發(fā)布的報(bào)告,對(duì)2005-2009年的字詞語(yǔ)調(diào)查數(shù)據(jù)進(jìn)行了比較,從共時(shí)、歷時(shí)兩個(gè)角度對(duì)五年的字詞語(yǔ)使用狀況進(jìn)行了分析。
(一)漢字使用情況
1. 年度高頻字?jǐn)?shù)量穩(wěn)定,字種數(shù)量有所增加
2009年度語(yǔ)料中共出現(xiàn)10 204個(gè)字種,高頻漢字?jǐn)?shù)量穩(wěn)定,覆蓋率達(dá)到80%、90%、99%的字種數(shù)分別為602、970、2 400個(gè)。
體現(xiàn)2009年度生活的漢字使用頻率有所增加,比如“汶、嬰、杭、飆、碳、迪、拓、旱、悍、蒜”等,在年度用字總表中的排序較往年有較大幅度的前提。
2009年度使用的字種數(shù)量是歷年調(diào)查中最多的。這與當(dāng)年語(yǔ)言生活中的漢字“繁簡(jiǎn)之爭(zhēng)”,“《通用規(guī)范漢字表》(征求意見(jiàn)稿)公開(kāi)征求意見(jiàn)”,以及網(wǎng)絡(luò)中漢字使用追求標(biāo)新立異有關(guān)。低頻字?jǐn)?shù)量多,漢字總表中覆蓋率達(dá)到99.99%的漢字共計(jì)5336個(gè),若將覆蓋率達(dá)到99.99%之后所有漢字看作低頻字,則2009年度的低頻字占漢字總數(shù)的47.71%。
2009年度用字總表中,包括了繁體字、異體字、不規(guī)范的類推簡(jiǎn)化字、舊計(jì)量單位用字、日本漢字等共計(jì)1804個(gè),占全部年度用字的17.68%。
2. 五年用字總表的高頻字穩(wěn)定,年度特色用字使用頻率變化較大
五年的用字調(diào)查顯示,覆蓋率達(dá)到80%、90%、99%的漢字個(gè)數(shù)分別在581~602、934~971、2314~2400之間,其占漢字總數(shù)的比例分別沒(méi)有超過(guò)7.15%、11.49%、28.47%,也就是說(shuō)每一年不超過(guò)用字總量30%的高頻漢字覆蓋了全部語(yǔ)料的99%。因此高頻字的使用數(shù)量相對(duì)穩(wěn)定。同時(shí),每年前3500個(gè)漢字中,有3358個(gè)漢字是相同的,使用的字種也具有穩(wěn)定性。
對(duì)比每一年的用字總表,高頻用字使用頻率變化最大的漢字往往體現(xiàn)了年度的語(yǔ)言生活特點(diǎn),低頻用字使用偶發(fā)性較強(qiáng),多用于專名。
3. 年度用字總表與現(xiàn)行規(guī)范字表之間的差異大于年度字表之間的差異
五個(gè)年度的用字調(diào)查表明,年度用字表前2500字與一級(jí)常用字之間的差異字種數(shù)在342~357個(gè)之間,前3500字與《現(xiàn)代漢語(yǔ)常用字表》之間的差異字種數(shù)在388~401個(gè)之間,前7000字與《現(xiàn)代漢語(yǔ)通用字表》差異字?jǐn)?shù)在506~725個(gè)之間,而每一年度《現(xiàn)代漢語(yǔ)通用字表》中未出現(xiàn)在語(yǔ)料中的漢字個(gè)數(shù)在160~244個(gè)之間,有47個(gè)漢字在五年全部字表中均未出現(xiàn)。
比較年度的用字總表與現(xiàn)行規(guī)范字表,媒體語(yǔ)料用字的相同性要大于媒體用字與現(xiàn)行規(guī)范字表之間的相同性。在媒體語(yǔ)料五年都出現(xiàn)的漢字中,有661個(gè)漢字沒(méi)有在《現(xiàn)代漢語(yǔ)通用字表》出現(xiàn)。
(二)詞語(yǔ)使用情況
1. 年度詞語(yǔ)使用總體相同性小,高頻詞語(yǔ)的變化體現(xiàn)年度特色
調(diào)查中由分詞軟件對(duì)語(yǔ)料切分得到的總詞語(yǔ)數(shù)共計(jì)592 414 821詞次,詞種數(shù)計(jì)2 348 100個(gè)。其中在報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)三類媒體都出現(xiàn)的詞種數(shù)共計(jì)193 416個(gè)。
覆蓋率達(dá)到90%的高頻詞語(yǔ)共計(jì)12 517個(gè),剔除其中的一些專名、時(shí)間表達(dá)式等,在高頻詞語(yǔ)表中列出了11 635個(gè)詞語(yǔ)。
高頻詞語(yǔ)表的變化體現(xiàn)了年度特色。2009年度,新進(jìn)入到高頻詞語(yǔ)表中的包括“閱兵、世博、假幣、抗旱、哥本哈根、低俗、日全食、貝盧斯科尼、水價(jià)、獻(xiàn)禮”等;與往年高頻詞語(yǔ)相比,2009年度使用頻率變化較大的詞語(yǔ)包括“流感、世博、復(fù)蘇、60年、經(jīng)濟(jì)危機(jī)、全運(yùn)會(huì)、購(gòu)置稅、奧巴馬、下鄉(xiāng)、回暖”等,這些詞語(yǔ)如實(shí)記錄了2009年度社會(huì)生活。
語(yǔ)料中使用的成語(yǔ)種數(shù)是3 736個(gè),總次數(shù)為1 680 701次,占全部語(yǔ)料總詞次數(shù)的0.28%。成語(yǔ)的詞長(zhǎng)分布在3-8字之間,其中4字詞占全部成語(yǔ)種數(shù)的98.47%。高頻詞語(yǔ)中的成語(yǔ)共有27個(gè),占高頻詞語(yǔ)詞種數(shù)的0.22%。
2.五年詞語(yǔ)比較,總體變化大,高頻詞語(yǔ)使用穩(wěn)定,高頻詞語(yǔ)的微變體現(xiàn)年度特色
2005-2009年度的詞語(yǔ)調(diào)查中,每年的詞種數(shù)在165~235萬(wàn)之間,其中五年都使用的詞種個(gè)數(shù)為330 422個(gè),占全部詞種數(shù)的比例在14%~20%之間。三類媒體五年都使用的詞種數(shù)共計(jì)72 641個(gè),占全部詞種數(shù)的比例在3.09%~4.4%之間。反映出不同媒體、不同年度詞語(yǔ)使用的共性小,年度詞語(yǔ)使用變化較大。
高頻詞語(yǔ)的使用具有較強(qiáng)的穩(wěn)定性。2005-2009年度覆蓋率達(dá)到90%的高頻詞語(yǔ)穩(wěn)定在12 000個(gè)左右,其中五年都使用的詞種數(shù)共計(jì)9 933個(gè),約占高頻詞語(yǔ)的80%。高頻詞語(yǔ)的用字穩(wěn)定在2 600個(gè)左右,詞長(zhǎng)分布在1~9字之間,其中詞長(zhǎng)為2字、3字的詞語(yǔ)占全部高頻詞語(yǔ)的80%左右,長(zhǎng)詞多為專名或時(shí)間表達(dá)式。
年度之間高頻詞語(yǔ)的差別體現(xiàn)了年度生活,這些差別體現(xiàn)在詞語(yǔ)使用的頻率變化上,使得一些原本不很高頻的詞語(yǔ)進(jìn)入到高頻范圍,一些原本就在高頻詞語(yǔ)中的詞語(yǔ)排序前提。
3. 流行語(yǔ)
“2009年度中國(guó)媒體十大流行語(yǔ)”分8個(gè)常規(guī)類目和5個(gè)特色專題。8個(gè)常規(guī)類目是綜合類、國(guó)際時(shí)政類、國(guó)內(nèi)時(shí)政類、經(jīng)濟(jì)類、科技類、社會(huì)生活類、文化教育類和體育娛樂(lè)類;5個(gè)特色專題包括“新中國(guó)成立60周年專題”“兩岸及港澳專題”“環(huán)保專題”“甲型H1N1流感專題”和“社會(huì)問(wèn)題專題”。
4.新詞語(yǔ)
2009年度語(yǔ)料中共提取出新詞語(yǔ)396條。
就詞語(yǔ)長(zhǎng)度看,具有優(yōu)勢(shì)的依次是三字、二字、四字詞,其中三字詞語(yǔ)占51.01%。就詞語(yǔ)構(gòu)成材料看,完全由漢字構(gòu)成的新詞語(yǔ)有390條,占98.48%。就結(jié)構(gòu)方式看,有兩點(diǎn)值得注意:一是除傳統(tǒng)的偏正式能產(chǎn)性最高、占總詞數(shù)的53.54%外,后附加式合成詞比例較大,占26.77%;類后綴構(gòu)詞仍以這幾年居高不下的“~門、~族、~客、~奴、~友”等為主;二是2009年新詞語(yǔ)中疊音方式構(gòu)成的詞明顯增多,如“樓歪歪、橋粘粘、墻脆脆”等。就使用頻次分布看,2009年度新詞語(yǔ)出現(xiàn)頻次分布狀況仍是兩頭小、中間大,即特別高頻和特別低頻的詞語(yǔ)都不多。
從社會(huì)語(yǔ)言學(xué)角度進(jìn)行分析,2009年度新詞語(yǔ)有如下三個(gè)明顯特點(diǎn)。一是反映社會(huì)問(wèn)題的詞語(yǔ)以某些格式為標(biāo)志形成詞語(yǔ)群,如“被××”詞語(yǔ)群、“樓××”詞語(yǔ)群、“~執(zhí)法”詞語(yǔ)群等。二是體現(xiàn)“以人為本”理念,反映多元人群的詞語(yǔ)增多。僅以“~族、~客、~友、~男、~女、~派、~黨、~二代”為標(biāo)記的就有80條,加上其他表人群分類的,共有116條,占新詞語(yǔ)總數(shù)的28.86%。三是網(wǎng)絡(luò)詞語(yǔ)與社會(huì)生活詞語(yǔ)的迅速融合。2009年,所有能夠產(chǎn)生社會(huì)性傳播效果的事件幾乎都源自互聯(lián)網(wǎng)的揭示和推動(dòng),而后迅速被各種傳統(tǒng)媒體引用、傳播,網(wǎng)絡(luò)和傳統(tǒng)媒體相互作用,相互借力,這些詞語(yǔ)甚至成為描述2009年社會(huì)生活的流行語(yǔ)。
五、中文博客用字用語(yǔ)專項(xiàng)調(diào)查數(shù)據(jù)
今年,以2009年度的博客語(yǔ)料為基礎(chǔ),專門對(duì)中文博客進(jìn)行了多角度的分析和調(diào)查,調(diào)查內(nèi)容包括博客用戶發(fā)帖情況、博客用字用語(yǔ)情況以及博客標(biāo)簽使用情況。
博客語(yǔ)料采自新浪博客和搜狐博客,包括171 160個(gè)博客用戶全年發(fā)布的共計(jì)12 158 037個(gè)博客帖,平均每個(gè)用戶71個(gè)博客帖,共12 362 687 048字符次,其中漢字9 889 496 758字次。
(一)發(fā)帖量
統(tǒng)計(jì)結(jié)果表明,年發(fā)帖量小于或等于50的用戶占總用戶數(shù)的58.56%,發(fā)帖量小于或等于100的用戶占總用戶數(shù)的84.74%。
(二)機(jī)構(gòu)名、地名、人名使用情況
從機(jī)構(gòu)名類型所分布的情況發(fā)現(xiàn),博客作者關(guān)注更多的是與時(shí)事、政治、軍事等相關(guān)的領(lǐng)域,其次是與傳媒、金融、教育等相關(guān)的話題。
在前50個(gè)高分布率地名中,中國(guó)國(guó)內(nèi)地名34個(gè),國(guó)外地名16個(gè),國(guó)外地名多為國(guó)家名,城市名中僅 “紐約” 1個(gè)。中國(guó)國(guó)內(nèi)地名中,省、自治區(qū)名16個(gè),其中“臺(tái)灣”、“四川”、“廣東”居前三位;城市名16個(gè),“北京”、“上海”居所有城市名的榜首,“香港”名列第三位。
分析前50個(gè)高分布率人名:(1)從國(guó)別上看,國(guó)內(nèi)人名占絕大多數(shù),有39個(gè),國(guó)外人名有11個(gè)。比較國(guó)內(nèi)外人名可以發(fā)現(xiàn):第一、國(guó)內(nèi)沒(méi)有經(jīng)濟(jì)界人名進(jìn)入前50個(gè)高分布率人名中,而國(guó)外人名居首的是經(jīng)濟(jì)界名人“巴菲特”,其次才是政治界名人“布什”。第二、國(guó)外沒(méi)有影視娛樂(lè)界人名進(jìn)入前50,而國(guó)內(nèi)影視娛樂(lè)界人名卻占很大優(yōu)勢(shì),共11個(gè)。第三、在11個(gè)國(guó)外人名中,有2個(gè)是宗教人名,國(guó)內(nèi)人名中則為先秦諸子,如“孔子”“孟子”“莊子”等。(2)從人物身份所屬類別上看,居前幾位的都是近現(xiàn)代政治人物,其中“毛澤東”“胡錦濤”“溫家寶”“鄧小平”“蔣介石”“周恩來(lái)”6位進(jìn)入了人名前10位。分析類別可以發(fā)現(xiàn),博客作者在人名的關(guān)注上存在一個(gè)傾向,即政治人物>歷史人物>娛樂(lè)界人物>文學(xué)界人物>體育界人物。
(三)博客標(biāo)簽調(diào)查
博客標(biāo)簽體現(xiàn)了博客所關(guān)注的主題,博客用戶可以為發(fā)布的每篇日志添加一個(gè)或多個(gè)標(biāo)簽。
出現(xiàn)頻次最高的十個(gè)單字標(biāo)簽是:愛(ài)、詩(shī)、我、性、夢(mèng)、家、雪、雨、詞、花。
出現(xiàn)頻次最高的十個(gè)雙字標(biāo)簽是:雜談、情感、文化、股票、娛樂(lè)、財(cái)經(jīng)、教育、育兒、休閑、健康。
出現(xiàn)頻次最高的十個(gè)三字標(biāo)簽是:互聯(lián)網(wǎng)、小沈陽(yáng)、情人節(jié)、我記錄、章子怡、毛澤東、劉德華、張柏芝、奧巴馬、鄧玉嬌。
出現(xiàn)頻次最高的十個(gè)四字標(biāo)簽是:生活記錄、感悟隨筆、金融危機(jī)、親情友情、東方神起、人體藝術(shù)、招標(biāo)文件、文學(xué)原創(chuàng)、操作策略、非誠(chéng)勿擾。
六、基礎(chǔ)教育階段小學(xué)語(yǔ)文教材漢字使用調(diào)查
調(diào)查涉及8套小學(xué)語(yǔ)文教材。其中中國(guó)大陸6套、中國(guó)臺(tái)灣1套、中國(guó)香港1套。中國(guó)大陸教材中屬新課標(biāo)版的3套,義務(wù)教育版的3套。
調(diào)查采用的是位序調(diào)查法,即統(tǒng)計(jì)首次出現(xiàn)的生字,先按冊(cè)序,次按課文序,再按一篇課文內(nèi)的生字先后排序。8套教材的生字位序之和除以教材總套數(shù),即可得到每個(gè)漢字的位序值。
(一)字量調(diào)查
8套教材共出現(xiàn)不同的漢字字種3855個(gè)。生字出現(xiàn)最多的是人教社的新課標(biāo)版,為2997個(gè);最少的是臺(tái)灣的康軒版,為2328個(gè)。8套教材皆有的生字為1397個(gè),占總生字?jǐn)?shù)的36.24%;只在一套教材中出現(xiàn)的生字有505個(gè),占總生字?jǐn)?shù)的13.1%。顯示各教材生字總量相差不大,但在選取哪些漢字上差異則相當(dāng)大。
只出現(xiàn)在一套教材的有505個(gè)獨(dú)用字,其中28個(gè)屬于《現(xiàn)代漢語(yǔ)常用字表》2500個(gè)“常用字”范圍,有169個(gè)屬于1000個(gè)“次常用字”范圍,296個(gè)在“常用字”和“次常用字”范圍之外。
通過(guò)對(duì)總字次、總字種數(shù)、共用、部分共用、獨(dú)用情況的調(diào)查,可以發(fā)現(xiàn)生字教學(xué)用字的兩個(gè)特點(diǎn):(1)每套教材的生字總字種數(shù)相差不大;(2)教材之間的生字字種差異大。
(二)首現(xiàn)生字調(diào)查
一個(gè)漢字首次出現(xiàn)在生字教學(xué)用字中,即為“首現(xiàn)生字”。首現(xiàn)生字的調(diào)查結(jié)果顯示:
1.漢字教學(xué)的高峰集中在第2、3、4學(xué)期,即小學(xué)一年級(jí)下學(xué)期與二年級(jí)全年。第11、12學(xué)期即六年級(jí),漢字教學(xué)的份量明顯下降。有的是到高年級(jí)沒(méi)有再安排生字教學(xué),有的是只有漢字復(fù)現(xiàn)式教學(xué)。
2.第1學(xué)期生字占的份量不算最多,是因?yàn)榈?SPAN>1學(xué)期前半期都安排了拼音教學(xué)。
3.人教新課標(biāo)版的生字教學(xué)字量起伏最大。在第2學(xué)期安排的漢字教學(xué)量明顯高出其他教材。
4.康軒版的首現(xiàn)漢字分布最為平緩。在12個(gè)學(xué)期基本上是均勻地進(jìn)行漢字教學(xué),最少的102字,最多的253字,呈現(xiàn)出中間略微突起、兩端稍稍下傾的平緩延伸線。
第1冊(cè)的首現(xiàn)生字,反映的是整個(gè)小學(xué)漢字教學(xué)起始階段學(xué)習(xí)的漢字。8套教材第1冊(cè)的首現(xiàn)生字共有773個(gè),在8套教材都出現(xiàn)的有33個(gè),在7套教材出現(xiàn)的有38個(gè),只在1套教材出現(xiàn)的為299個(gè)。第1冊(cè)共用生字的比例遠(yuǎn)遠(yuǎn)低于整個(gè)小學(xué)階段共用生字的比例,為4.27%︰36.24%;第1冊(cè)獨(dú)用字的比例遠(yuǎn)遠(yuǎn)高于整個(gè)小學(xué)教材獨(dú)用字的比例,為38.68%︰13.10%。表現(xiàn)出漢字學(xué)習(xí)初始階段的差異大于整個(gè)小學(xué)階段的生字學(xué)習(xí)差異的特點(diǎn)。
七、少數(shù)民族語(yǔ)言(藏語(yǔ)、維吾爾語(yǔ))用詞狀況調(diào)查
本次調(diào)查涉及藏文及維吾爾文兩個(gè)文種,由國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心少數(shù)民族語(yǔ)言分中心(中央民族大學(xué))及藏語(yǔ)文基地(西北民族大學(xué))、維吾爾語(yǔ)文基地(新疆師范大學(xué))共同完成。
(一)小學(xué)藏語(yǔ)文新課標(biāo)教材用詞調(diào)查
本次調(diào)查以青海民族出版社2009年5月出版的五?。▍^(qū))藏《語(yǔ)文》實(shí)驗(yàn)教科書為對(duì)象,主要包括課文生詞和課文用詞兩方面調(diào)查內(nèi)容。
1. 課文生詞
課文生詞指課后生詞表中出現(xiàn)的詞。調(diào)查顯示:教材中第1至12冊(cè)共有2 255個(gè)課文生詞。
調(diào)查結(jié)果顯示,藏語(yǔ)文教材各冊(cè)課文生詞中雙音節(jié)詞均占優(yōu)勢(shì)。將各詞長(zhǎng)按所占比例排序,順序依次為:雙音節(jié)詞、單音節(jié)詞、三音節(jié)詞、四音節(jié)詞。其中單音節(jié)和雙音節(jié)詞共計(jì)2164個(gè),占生詞總數(shù)的95.96%。這體現(xiàn)了基礎(chǔ)教育階段的詞匯學(xué)習(xí)以常用和較簡(jiǎn)單的詞匯為主。
在對(duì)課文生詞在課文中出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)時(shí)發(fā)現(xiàn):從詞長(zhǎng)1到詞長(zhǎng)4,生詞長(zhǎng)度越長(zhǎng),使用頻次越低。
2. 課文用詞
課文用詞是指在課文中出現(xiàn)的所有詞種。調(diào)查顯示:全部12冊(cè)教材共出現(xiàn)詞種9 224條,詞次總數(shù)97 366條。由于動(dòng)詞存在“三時(shí)一式”的形態(tài)變化,前后綴形成的派生詞大量存在,使得課文用詞種數(shù)遠(yuǎn)大于課文生詞種數(shù)。課文詞種數(shù)的分布整體呈上升趨勢(shì),隨著年級(jí)的升高,學(xué)習(xí)的詞種數(shù)逐漸增加,這種循環(huán)漸進(jìn)的教學(xué)模式有利于學(xué)生的學(xué)習(xí)。
調(diào)查項(xiàng)目還包括各課文體裁詞種數(shù)、各冊(cè)詞種數(shù)、詞總數(shù)及各冊(cè)獨(dú)用詞統(tǒng)計(jì)、詞頻統(tǒng)計(jì),以及前500高頻詞調(diào)查等。
本次調(diào)查是我國(guó)首次就少數(shù)民族語(yǔ)言教育教材的使用狀況進(jìn)行調(diào)查,為教材的客觀評(píng)價(jià)提供了定量參考,為藏文量化字詞教學(xué)目標(biāo)的制定提供了依據(jù),也為今后更好地提高藏語(yǔ)文教材的編寫質(zhì)量奠定了一定的基礎(chǔ)。
(二)維吾爾文網(wǎng)站用詞調(diào)查
本次調(diào)查涉及“新疆政府網(wǎng)”、“昆侖網(wǎng)”、“天山網(wǎng)”、“新疆信息網(wǎng)”、“新疆友通電子科技”、“新疆哲學(xué)社會(huì)科學(xué)網(wǎng)”、“教師網(wǎng)”、“莎車教育網(wǎng)”及“維吾爾醫(yī)學(xué)”等9家維吾爾文網(wǎng)站,語(yǔ)料采集的時(shí)間跨度為2006年4月至2009年12月,語(yǔ)料內(nèi)容為與大眾日常生活密切相關(guān)的政治、經(jīng)濟(jì)、科學(xué)研究、教育、健康等多個(gè)領(lǐng)域??傉Z(yǔ)料詞符種數(shù)197 687條、詞符頻次5 473 792、文本數(shù)15 878個(gè)。具體調(diào)查結(jié)果如下:
1. 符號(hào)調(diào)查
本次調(diào)查的維吾爾文符號(hào)包括標(biāo)點(diǎn)、數(shù)字和其他符號(hào)(不含不可顯示的字符、空格符等)。調(diào)查中共出現(xiàn)38種符號(hào),占詞符總數(shù)的0.02%;出現(xiàn)頻次為1 368 520頻次,占詞符總頻次的25.00%。
2. 詞尾調(diào)查
現(xiàn)代維吾爾文的詞形變化豐富,通過(guò)綴接不同的詞尾表示詞與詞之間各種不同的語(yǔ)法關(guān)系。如?????(你們)加詞尾-??后,原詞語(yǔ)變成???????(你們認(rèn)為)。本次調(diào)查詞尾頻次總數(shù)為118 848條,詞尾種數(shù)為4 448種,其中頻次超過(guò)萬(wàn)次以上詞尾種數(shù)為32種,如具有雙重功能附加成分的詞尾“-??”; 同時(shí)體現(xiàn)一個(gè)以上的語(yǔ)法功能的詞尾“-???”等。
3. 詞干調(diào)查
維吾爾語(yǔ)詞干可分為純?cè)~干和去尾詞干。由詞根或詞根綴接詞綴直接形成詞語(yǔ)的詞干稱為純?cè)~干;而將去除詞尾的詞干稱為去尾詞干。這種去尾詞干的存在是由黏著語(yǔ)的特點(diǎn)所決定的。本次調(diào)查對(duì)去尾詞干的統(tǒng)計(jì)是在對(duì)維吾爾語(yǔ)詞的詞形還原后進(jìn)行的,例如:????????(工人的)一詞,去掉詞尾???后的詞干是?????(工人)。本次調(diào)查統(tǒng)計(jì)得到純?cè)~干24 149種,去尾詞干20 111種。然而,純?cè)~干和去尾詞干有部分詞形相同,總詞干是指濾除純?cè)~干和帶尾詞干重疊部分后的所有純?cè)~干和帶尾詞干,統(tǒng)計(jì)得到的總詞干31 452種。
4. 用詞調(diào)查
用詞調(diào)查項(xiàng)目包括詞在語(yǔ)料中出現(xiàn)的頻次、頻率、詞語(yǔ)長(zhǎng)度、文本數(shù)等。在用詞調(diào)查項(xiàng)目中共得到詞種數(shù)197 649條、詞頻410 5267。具體可從以下幾個(gè)方面來(lái)分析維吾爾語(yǔ)的網(wǎng)絡(luò)用詞情況:
1)詞語(yǔ)分頻段使用情況:統(tǒng)計(jì)結(jié)果顯示,維吾爾語(yǔ)中的低頻詞種數(shù)量龐大,其中頻次為1的詞占總詞種數(shù)的50.58%,頻次不超過(guò)10的詞語(yǔ)占總詞語(yǔ)種數(shù)的86.48%。
2)詞語(yǔ)中首字母與詞種數(shù)分布情況:以 ?、?、?、?、?、?、?、??等8個(gè)字母開(kāi)始的詞種數(shù)量達(dá)萬(wàn)種以上,以 ??、?、?、?、? 等字母開(kāi)始的詞種數(shù)量在千條以下,而以其他字母開(kāi)始的詞種數(shù)量都在2 252條至8 097條之間。
3)詞種使用情況:統(tǒng)計(jì)結(jié)果顯示了維吾爾語(yǔ)用詞相對(duì)集中的特點(diǎn)。詞頻累加覆蓋率為10%時(shí)使用詞種僅27種,占全部用詞種數(shù)的0.02%;而詞頻累加覆蓋率為90%時(shí)的詞種數(shù)量為21 607,僅占全部語(yǔ)料詞種數(shù)的10.93%。
4)高頻詞使用情況:高頻詞指在調(diào)查語(yǔ)料中詞頻累加覆蓋率達(dá)到90%的全部用詞。統(tǒng)計(jì)結(jié)果顯示高頻詞的詞種數(shù)為21 607條,占全部詞種數(shù)的10.93%。
5)詞長(zhǎng)分布情況:詞長(zhǎng)為1-4個(gè)字母的詞只占全部詞種數(shù)的2.55%,占全部詞頻的14.76%,說(shuō)明在實(shí)際應(yīng)用中,維吾爾文詞長(zhǎng)為1-4個(gè)字母的詞使用較少,日常使用主要以4字母以上詞為主;另一方面,詞長(zhǎng)超過(guò)20個(gè)字母的長(zhǎng)詞數(shù)量為812個(gè),僅占全部詞種數(shù)的0.40%,這類詞的使用頻度也很低,僅占全部語(yǔ)料詞頻總數(shù)的0.02%。
6)詞語(yǔ)的文本分布情況:本次調(diào)查的語(yǔ)料文本總數(shù)為15 878篇,其中只在1篇文本中出現(xiàn)的詞種數(shù)為107 144個(gè),占全部詞種數(shù)的54.15%,而出現(xiàn)文本數(shù)小于6篇的用詞占全部詞種數(shù)的81.66%。由此可看出,大多數(shù)詞并非常用詞匯,出現(xiàn)的文本數(shù)量很低,這也體現(xiàn)了維吾爾文網(wǎng)絡(luò)用詞豐富的特點(diǎn)。
調(diào)查還公布了維文網(wǎng)站前1000個(gè)高頻詞干。
(《中國(guó)語(yǔ)言生活狀況報(bào)告(2009)》已由商務(wù)印書館出版發(fā)行。)
版權(quán)所有:中華人民共和國(guó)教育部 中文域名:教育部.政務(wù)
京ICP備10028400號(hào)-1 京公網(wǎng)安備11010202007625號(hào) 網(wǎng)站標(biāo)識(shí)碼:bm05000001