找回密碼
 To register

QQ登錄

只需一步,快速開始

掃一掃,訪問微社區(qū)

打印 上一主題 下一主題

Titlebook: Web Corpus Construction; Roland Sch?fer,Felix Bildhauer Book 2013 Springer Nature Switzerland AG 2013

[復(fù)制鏈接]
查看: 39545|回復(fù): 35
樓主
發(fā)表于 2025-3-21 17:57:39 | 只看該作者 |倒序?yàn)g覽 |閱讀模式
書目名稱Web Corpus Construction
編輯Roland Sch?fer,Felix Bildhauer
視頻videohttp://file.papertrans.cn/1022/1021467/1021467.mp4
叢書名稱Synthesis Lectures on Human Language Technologies
圖書封面Titlebook: Web Corpus Construction;  Roland Sch?fer,Felix Bildhauer Book 2013 Springer Nature Switzerland AG 2013
描述The World Wide Web constitutes the largest existing source of texts written in a great variety of languages. A feasible and sound way of exploiting this data for linguistic research is to compile a static corpus for a given language. There are several adavantages of this approach: (i) Working with such corpora obviates the problems encountered when using Internet search engines in quantitative linguistic research (such as non-transparent ranking algorithms). (ii) Creating a corpus from web data is virtually free. (iii) The size of corpora compiled from the WWW may exceed by several orders of magnitudes the size of language resources offered elsewhere. (iv) The data is locally available to the user, and it can be linguistically post-processed and queried with the tools preferred by her/him. This book addresses the main practical tasks in the creation of web corpora up to giga-token size. Among these tasks are the sampling process (i.e., web crawling) and the usual cleanups including boilerplate removal and removal of duplicated content. Linguistic processing and problems with linguistic processing coming from the different kinds of noise in web corpora are also covered. Finally, the
出版日期Book 2013
版次1
doihttps://doi.org/10.1007/978-3-031-02152-7
isbn_softcover978-3-031-01024-8
isbn_ebook978-3-031-02152-7Series ISSN 1947-4040 Series E-ISSN 1947-4059
issn_series 1947-4040
copyrightSpringer Nature Switzerland AG 2013
The information of publication is updating

書目名稱Web Corpus Construction影響因子(影響力)




書目名稱Web Corpus Construction影響因子(影響力)學(xué)科排名




書目名稱Web Corpus Construction網(wǎng)絡(luò)公開度




書目名稱Web Corpus Construction網(wǎng)絡(luò)公開度學(xué)科排名




書目名稱Web Corpus Construction被引頻次




書目名稱Web Corpus Construction被引頻次學(xué)科排名




書目名稱Web Corpus Construction年度引用




書目名稱Web Corpus Construction年度引用學(xué)科排名




書目名稱Web Corpus Construction讀者反饋




書目名稱Web Corpus Construction讀者反饋學(xué)科排名




單選投票, 共有 0 人參與投票
 

0票 0%

Perfect with Aesthetics

 

0票 0%

Better Implies Difficulty

 

0票 0%

Good and Satisfactory

 

0票 0%

Adverse Performance

 

0票 0%

Disdainful Garbage

您所在的用戶組沒有投票權(quán)限
沙發(fā)
發(fā)表于 2025-3-21 23:59:57 | 只看該作者
板凳
發(fā)表于 2025-3-22 03:53:24 | 只看該作者
Web Corpus Construction978-3-031-02152-7Series ISSN 1947-4040 Series E-ISSN 1947-4059
地板
發(fā)表于 2025-3-22 06:01:49 | 只看該作者
5#
發(fā)表于 2025-3-22 09:30:33 | 只看該作者
6#
發(fā)表于 2025-3-22 13:50:33 | 只看該作者
7#
發(fā)表于 2025-3-22 17:19:22 | 只看該作者
8#
發(fā)表于 2025-3-22 21:48:15 | 只看該作者
9#
發(fā)表于 2025-3-23 05:24:04 | 只看該作者
10#
發(fā)表于 2025-3-23 06:22:17 | 只看該作者
Roland Sch?fer,Felix Bildhauerung gesetzt. So hie? es etwa mehrfach in der Presse: “Im Hochhaus gedeiht das Verbrechen”. Oder: “Die Kriminalit?t steigt mit der Anzahl der Stockwerke im Hochhaus”. Die mit dem Begriff “Jugendkriminalit?t” bezeichneten Probleme scheinen nicht nur in den Innenst?dten, sondern auch in überdurchschnit
 關(guān)于派博傳思  派博傳思旗下網(wǎng)站  友情鏈接
派博傳思介紹 公司地理位置 論文服務(wù)流程 影響因子官網(wǎng) 吾愛論文網(wǎng) 大講堂 北京大學(xué) Oxford Uni. Harvard Uni.
發(fā)展歷史沿革 期刊點(diǎn)評(píng) 投稿經(jīng)驗(yàn)總結(jié) SCIENCEGARD IMPACTFACTOR 派博系數(shù) 清華大學(xué) Yale Uni. Stanford Uni.
QQ|Archiver|手機(jī)版|小黑屋| 派博傳思國際 ( 京公網(wǎng)安備110108008328) GMT+8, 2025-10-15 01:41
Copyright © 2001-2015 派博傳思   京公網(wǎng)安備110108008328 版權(quán)所有 All rights reserved
快速回復(fù) 返回頂部 返回列表
昌平区| 宜宾县| 乌拉特后旗| 仙居县| 寿宁县| 大关县| 梓潼县| 大埔县| 衡南县| 阆中市| 宣城市| 运城市| 贵南县| 苗栗县| 泸州市| 宁远县| 铜鼓县| 徐水县| 长顺县| 铜鼓县| 临潭县| 镇赉县| 梁平县| 汾西县| 汉川市| 安平县| 江津市| 堆龙德庆县| 云龙县| 黄龙县| 黄骅市| 二连浩特市| 盐边县| 桂林市| 石泉县| 普定县| 比如县| 治县。| 建平县| 华安县| 乌拉特后旗|