找回密碼
 To register

QQ登錄

只需一步,快速開始

掃一掃,訪問微社區(qū)

打印 上一主題 下一主題

Titlebook: Web Corpus Construction; Roland Sch?fer,Felix Bildhauer Book 2013 Springer Nature Switzerland AG 2013

[復(fù)制鏈接]
查看: 39552|回復(fù): 35
樓主
發(fā)表于 2025-3-21 17:57:39 | 只看該作者 |倒序瀏覽 |閱讀模式
書目名稱Web Corpus Construction
編輯Roland Sch?fer,Felix Bildhauer
視頻videohttp://file.papertrans.cn/1022/1021467/1021467.mp4
叢書名稱Synthesis Lectures on Human Language Technologies
圖書封面Titlebook: Web Corpus Construction;  Roland Sch?fer,Felix Bildhauer Book 2013 Springer Nature Switzerland AG 2013
描述The World Wide Web constitutes the largest existing source of texts written in a great variety of languages. A feasible and sound way of exploiting this data for linguistic research is to compile a static corpus for a given language. There are several adavantages of this approach: (i) Working with such corpora obviates the problems encountered when using Internet search engines in quantitative linguistic research (such as non-transparent ranking algorithms). (ii) Creating a corpus from web data is virtually free. (iii) The size of corpora compiled from the WWW may exceed by several orders of magnitudes the size of language resources offered elsewhere. (iv) The data is locally available to the user, and it can be linguistically post-processed and queried with the tools preferred by her/him. This book addresses the main practical tasks in the creation of web corpora up to giga-token size. Among these tasks are the sampling process (i.e., web crawling) and the usual cleanups including boilerplate removal and removal of duplicated content. Linguistic processing and problems with linguistic processing coming from the different kinds of noise in web corpora are also covered. Finally, the
出版日期Book 2013
版次1
doihttps://doi.org/10.1007/978-3-031-02152-7
isbn_softcover978-3-031-01024-8
isbn_ebook978-3-031-02152-7Series ISSN 1947-4040 Series E-ISSN 1947-4059
issn_series 1947-4040
copyrightSpringer Nature Switzerland AG 2013
The information of publication is updating

書目名稱Web Corpus Construction影響因子(影響力)




書目名稱Web Corpus Construction影響因子(影響力)學(xué)科排名




書目名稱Web Corpus Construction網(wǎng)絡(luò)公開度




書目名稱Web Corpus Construction網(wǎng)絡(luò)公開度學(xué)科排名




書目名稱Web Corpus Construction被引頻次




書目名稱Web Corpus Construction被引頻次學(xué)科排名




書目名稱Web Corpus Construction年度引用




書目名稱Web Corpus Construction年度引用學(xué)科排名




書目名稱Web Corpus Construction讀者反饋




書目名稱Web Corpus Construction讀者反饋學(xué)科排名




單選投票, 共有 0 人參與投票
 

0票 0%

Perfect with Aesthetics

 

0票 0%

Better Implies Difficulty

 

0票 0%

Good and Satisfactory

 

0票 0%

Adverse Performance

 

0票 0%

Disdainful Garbage

您所在的用戶組沒有投票權(quán)限
沙發(fā)
發(fā)表于 2025-3-21 23:59:57 | 只看該作者
板凳
發(fā)表于 2025-3-22 03:53:24 | 只看該作者
Web Corpus Construction978-3-031-02152-7Series ISSN 1947-4040 Series E-ISSN 1947-4059
地板
發(fā)表于 2025-3-22 06:01:49 | 只看該作者
5#
發(fā)表于 2025-3-22 09:30:33 | 只看該作者
6#
發(fā)表于 2025-3-22 13:50:33 | 只看該作者
7#
發(fā)表于 2025-3-22 17:19:22 | 只看該作者
8#
發(fā)表于 2025-3-22 21:48:15 | 只看該作者
9#
發(fā)表于 2025-3-23 05:24:04 | 只看該作者
10#
發(fā)表于 2025-3-23 06:22:17 | 只看該作者
Roland Sch?fer,Felix Bildhauerung gesetzt. So hie? es etwa mehrfach in der Presse: “Im Hochhaus gedeiht das Verbrechen”. Oder: “Die Kriminalit?t steigt mit der Anzahl der Stockwerke im Hochhaus”. Die mit dem Begriff “Jugendkriminalit?t” bezeichneten Probleme scheinen nicht nur in den Innenst?dten, sondern auch in überdurchschnit
 關(guān)于派博傳思  派博傳思旗下網(wǎng)站  友情鏈接
派博傳思介紹 公司地理位置 論文服務(wù)流程 影響因子官網(wǎng) 吾愛論文網(wǎng) 大講堂 北京大學(xué) Oxford Uni. Harvard Uni.
發(fā)展歷史沿革 期刊點評 投稿經(jīng)驗總結(jié) SCIENCEGARD IMPACTFACTOR 派博系數(shù) 清華大學(xué) Yale Uni. Stanford Uni.
QQ|Archiver|手機(jī)版|小黑屋| 派博傳思國際 ( 京公網(wǎng)安備110108008328) GMT+8, 2025-10-15 05:44
Copyright © 2001-2015 派博傳思   京公網(wǎng)安備110108008328 版權(quán)所有 All rights reserved
快速回復(fù) 返回頂部 返回列表
乐山市| 察哈| 内乡县| 弥勒县| 观塘区| 旬邑县| 玛多县| 普定县| 深州市| 台北市| 嘉善县| 洛宁县| 莒南县| 高邮市| 都兰县| 襄城县| 浦江县| 延长县| 芦溪县| 内乡县| 富平县| 江源县| 绥德县| 盐池县| 南充市| 工布江达县| 浙江省| 英山县| 嘉鱼县| 巴东县| 济源市| 贵南县| 桦南县| 邵阳县| 岳普湖县| 凌源市| 罗田县| 公安县| 芜湖市| 颍上县| 玛曲县|