TUD v2-Sözcük ve Doküman Sayıları
Sorgu Arayüzü
Derlem Hakkında
Yayınlar
Hakkımızda

İÇERİK

TUD içeriği 50 milyon sözcükle sınırlandırılmıştır ve % 98 oranında çok çeşitli türlerden ve 20 yıllık bir zaman aralığında yayınlanmış (1990-2009) yazılı metinlerden oluşmaktadır. TUD'un %2'si ise yazıya aktarılmış konuşmalar ya da sözlü veridir. TUD metinlerinin sözcük sayıları ve dağılımları, yayın yılı, konu alanı ve metin türü ölçütlerine dayalı olarak oranlanmıştır. Böylelikle çok çeşitli konu alanlarını kapsayan Türkçe yazılı metinlerden örneklem yoluyla derlem veritabanı oluşturulmuştur.

TUD Yazılı Metinlerinin Dağılımı

Konu Alanı

%

Tür

%

Kurgusal Düzyazı

19

Kitap

58

Toplum Bilimleri

16

Süreli Yayın

32

Sanat

7

Çeşitli Yayınlanmış Metinler

5

Ticaret ve Finans

8

Çeşitli Yayınlanmamış Metinler

3

Düşünce ve İnanç

4

Konuşma Metinleri

2

Dünya Sorunları

20

Uygulamalı Bilimler

8

Doğa ve Temel Bilimler

4

Diğer

14

konu alanlari

Anlık, gündelik iletişim ya da konuşmaların yazıya aktarılmasıyla elde edilen sözlü veri ise TUD'un %2'sini oluşturmaktadır.