alexa
置頂

這個用詞!這種說法!原來真正透露你的年紀的是…

【遠見×大數聚︱數據看現象】
文 / 大數聚    
2016-05-01
瀏覽數 6,050+
這個用詞!這種說法!原來真正透露你的年紀的是…
分享 Line分享分享 複製連結

首圖來源:ytimg

想像一下,當老爸在吃年夜飯的時候,蹦出了以下的話語:

「你兒子魯了那麼久,都成年滷味了,什麼時候閃光get啊?」

在這個當下除了晚輩們,跟老爸同年齡層的長輩應該都需要翻譯蒟蒻的支援了!類似的情境真實經常發生在網友分享的Dcard文章中,文內的爸爸因為用語時髦,引起廣大網友迴響,而有「狂爸」的封號。為什麼面對這樣的景況我們會邊噴笑邊覺得老爸太潮了呢?這就是年齡和用語交互作用造成的「反差萌」!

新的詞彙與意義在每一年都不停的萌生。網路溫度計也曾報導過有關於鄉民用詞以及大陸網民新詞入侵的現象。根據我們處理過的Google Books Ngram Corpus的語料(收錄1500年以來出版的書籍,約8,535,128字)所製作出的圖表可以發現,綜觀動詞、名詞、形容詞、副詞四種詞類,累積產出的詞彙,以名詞最多。從語意學(Semantics)與社會語言學(Sociolinguistics)的角度而言,或許主要是因為名詞所指涉的人事物更需要與時俱進,因此在替代與產出需求更大:

這個用詞!這種說法!原來真正透露你的年紀的是…

雖然千百年來累積的詞彙量這麼多,但其中有多少語言用法會一代代流傳下去,漸漸大家習以為常地用於日常生活中呢?

假如穿越到二十多年前‧‧‧‧‧‧你,夠不夠潮呢?ˋvˊ

先來做個即時問卷測看看吧!

你是否發現才短短二、三十年,曾經耳熟能詳的新詞早已退流行,現在來用的話,不是無法溝通,就是顯得格外地「LKK」。面對不同時期,比雨後春筍還要迅速冒出的詞彙,辭典到底要收錄哪些詞?華語學習者又該著重在哪些比較當代詞彙的學習?是否能有一個基於大數據分析的汰選機制可以自動篩選預測哪些詞彙 「活」到下一代的可能性呢?(謎:有的話我們再收到辭典裡咩!~)

為了訓練機器預測模型,我們先從質性與量化的角度觀察了三類詞彙,試圖從中找出 「短命詞」跟「千年老妖詞」之間決定性的差別。這三類詞彙依據「活過的歲月」(淚)分別是:

千年老妖詞 如:「上」、「去」、「有」等

中生代詞 如:「抓包」、「認同」、「違規」等

近代新生詞 如:「ㄎㄎ」、「列退」、「低調」等

我們針對 2000 年以來批踢踢上二十個常用與熱門板,涵蓋遊戲、男女話題、情緒、經濟與不同地域主題,抽取了包含貼文與回文超過一億筆字詞的語料來了解這三類詞詞頻波動趨勢。以下三組圖表可以發現整體使用頻率多寡的排序:

千年老妖詞 > 近代新生詞 > 中生代詞

圖一:「千年老妖詞」

歷經時間的汰選而存留下來,自然中流砥柱,普遍地被使用著。

這個用詞!這種說法!原來真正透露你的年紀的是…

想知道「近代新生詞」和中生代詞究竟有哪些嗎?究竟詞語想要長生不老的話又需要具備什麼特性呢?讓我們繼續看下去!(作者:王伯雅、謝舒凱)

本文未完,精采全文詳見這個用詞!這種說法!原來真正透露你的年紀的是

專欄簡介:

這個用詞!這種說法!原來真正透露你的年紀的是…

【更多精采報導,請上《大數聚官網》;《DailyView網路溫度計官網》;《DailyView 網路溫度計粉絲團》未經授權, 請勿轉載!】

分享 Line分享分享 複製連結
生活
您可能會喜歡