fregimus: (Default)
[personal profile] fregimus
http://www.translatish.com/

Это ведь код, не язык? Слова почти не повторяются. Там такого текста целый здоровенный веб-сайт. Большинство из длинных «слов» больше нигде в сети не встречаются.

Ermim cubes progsez uns ceux bastua

Willuns til toisab witsie [micmark ties], narin siman nuriz dad boteur fod. Ned i kli edia gete kuk mann mendit suchown cin (geantir willuk). Satzop furcom beenlui nohue liarkin; net cialer pasmit ven ral ke gedis mefer ga cuarse arloinum ri deuthe anson sel moc port zeigt rungal velmay been enlio herdic mequi aun gikrup backent bailet wes klungas fontans paisdu. Ria rowent foga li nersuc kla fragi her pamit ousuch les ject et restin selfen enjekt reesem seem ban proachec vonres.

Quand ris uvb ain tasec miem plus stonion pergut omal way cola zis yearsis fuhcei con not yu dent decmad rernom cub foundai doef pleabad; guneast deut galres pointar monleg (&) auga four wellaf resmen chaus du supob fourpon sesfun delop. Boymar wor drenber miosualkunhun var klungis (&) hasto fin gru nomag prob deedbun ruargar. Cuad bes el {gar} burgup mievion main moform yik homfit genmer tutzug vion cermem fra vez serju frane fangu hunach tua sep mesei mij, firpeup stugirl zum sisor caingou nienag ont hua 55 gapren portim mentob totrio duebest sesou fach. Xisga vordonc gie lo kup tigeb, bildun mo doses aican hier sort {los} full pacan, cuicier mac duc hom gruplong gualiar tiocour bieree ciwith zul golcoc both feodown efwur sawgion ai.


И так далее… Статистика первой страницы:

Total words: 1987
Unique words: 1810
Score: 91.1%
Words and frequencies:
1. a 7 0.4%
2. ra 6 0.3%
3. cub 4 0.2%
4. li 4 0.2%
5. los 4 0.2%
6. re 4 0.2%
7. ver 4 0.2%
8. an 3 0.2%
9. ba 3 0.2%
10. buen 3 0.2%
11. cam 3 0.2%
12. ce 3 0.2%
13. dent 3 0.2%
14. des 3 0.2%
15. duc 3 0.2%
16. er 3 0.2%
17. im 3 0.2%
18. les 3 0.2%
19. let 3 0.2%
20. liar 3 0.2%
21. met 3 0.2%
22. moc 3 0.2%
23. ne 3 0.2%
24. ni 3 0.2%
25. pe 3 0.2%
26. ria 3 0.2%
27. to 3 0.2%
28. tts 3 0.2%
29. zul 3 0.2%
30. ag 2 0.1%
31. ain 2 0.1%
32. ar 2 0.1%
33. au 2 0.1%
34. ber 2 0.1%
35. bild 2 0.1%
36. bom 2 0.1%
37. bor 2 0.1%
38. cain 2 0.1%
39. chef 2 0.1%
40. cic 2 0.1%
41. cir 2 0.1%
42. co 2 0.1%
43. com 2 0.1%
44. con 2 0.1%
45. coup 2 0.1%
46. cu 2 0.1%
47. cul 2 0.1%
48. dann 2 0.1%
49. den 2 0.1%
50. der 2 0.1%
51. di 2 0.1%
52. dia 2 0.1%
53. doing 2 0.1%
54. don 2 0.1%
55. ei 2 0.1%
56. en 2 0.1%
57. felt 2 0.1%
58. fur 2 0.1%
59. ga 2 0.1%
60. gai 2 0.1%
61. gal 2 0.1%
62. gar 2 0.1%
63. gual 2 0.1%
64. halt 2 0.1%
65. help 2 0.1%
66. her 2 0.1%
67. hes 2 0.1%
68. hin 2 0.1%
69. i 2 0.1%
70. int 2 0.1%
71. klich 2 0.1%
72. lo 2 0.1%
73. long 2 0.1%
74. lue 2 0.1%
75. main 2 0.1%
76. mal 2 0.1%
77. mee 2 0.1%
78. mehr 2 0.1%
79. ment 2 0.1%
80. mo 2 0.1%
81. muy 2 0.1%
82. ner 2 0.1%
83. net 2 0.1%
84. new 2 0.1%
85. non 2 0.1%
86. our 2 0.1%
87. pa 2 0.1%
88. pes 2 0.1%
89. pos 2 0.1%
90. pou 2 0.1%
91. pour 2 0.1%
92. prit 2 0.1%
93. qui 2 0.1%
94. quic 2 0.1%
95. ral 2 0.1%
96. reit 2 0.1%
97. ren 2 0.1%
98. sa 2 0.1%
99. see 2 0.1%
100. sel 2 0.1%
101. ser 2 0.1%
102. sir 2 0.1%
103. six 2 0.1%
104. sol 2 0.1%
105. sort 2 0.1%
106. stel 2 0.1%
107. sun 2 0.1%
108. tab 2 0.1%
109. tan 2 0.1%
110. tar 2 0.1%
111. taz 2 0.1%
112. te 2 0.1%
113. tes 2 0.1%
114. this 2 0.1%
115. tho 2 0.1%
116. ti 2 0.1%
117. ties 2 0.1%
118. til 2 0.1%
119. tio 2 0.1%
120. told 2 0.1%
121. tout 2 0.1%
122. tral 2 0.1%
123. tre 2 0.1%
124. tua 2 0.1%
125. ven 2 0.1%
126. vion 2 0.1%
127. vo 2 0.1%
128. ward 2 0.1%
129. was 2 0.1%
130. wer 2 0.1%
131. wit 2 0.1%
132. wor 2 0.1%
133. year 2 0.1%
134. yu 2 0.1%
135. zeigt 2 0.1%
136. zon 2 0.1%

Остальных по одному. Что за чудеса? Если это код — надо разгадать!

Круто

2011-03-01 17:36 (UTC)
Posted by [identity profile] schegloff.livejournal.com
Слова-то как настоящие. Отличный генератор забытых языков. Как работает, подробно описано на сайте, вот только одна беда - на уже транслитерированном с английского :)

Может эта страница поможет найти декодер? http://www.translatish.com/framcal/velyart.html

Re: Круто

2011-03-01 19:19 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Мне пока не помогла.

(no subject)

2011-03-01 17:51 (UTC)
Posted by [identity profile] garvey-r.livejournal.com
Вот тут обсуждалось
http://dis.4chan.org/read/lang/1269042464&r

большая часть мнений - бред, подделка.

(no subject)

2011-03-01 19:20 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Мнений у меня самого как минимум пять разных, больше уж, кажется, и не надо…

(no subject)

2011-03-01 18:03 (UTC)
Posted by [identity profile] akalenuk.livejournal.com
Мне кажется, это осмысленный текст, переведенный на десяток языков подряд пословно. Что объясняет такую "размазанность" частот.

(no subject)

2011-03-01 19:21 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Хорошая идея. А какие именно языки? Узнаете слова?

(no subject)

Posted by [identity profile] akalenuk.livejournal.com - 2011-03-01 20:30 (UTC) - Expand

(no subject)

Posted by [identity profile] iad.livejournal.com - 2011-03-01 22:15 (UTC) - Expand

(no subject)

Posted by [identity profile] akalenuk.livejournal.com - 2011-03-02 10:30 (UTC) - Expand

(no subject)

2011-03-01 20:19 (UTC)
Posted by [identity profile] sepulkarium.livejournal.com
По многим словам гугл вообще ничего не находит, кроме этого сайта. Значит, нету таких слов

(no subject)

Posted by [identity profile] akalenuk.livejournal.com - 2011-03-01 20:36 (UTC) - Expand

(no subject)

Posted by [identity profile] antihydrogen.livejournal.com - 2011-03-02 09:38 (UTC) - Expand

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-02 09:39 (UTC) - Expand

(no subject)

Posted by [identity profile] antihydrogen.livejournal.com - 2011-03-02 09:55 (UTC) - Expand

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-02 10:04 (UTC) - Expand

(no subject)

Posted by (Anonymous) - 2011-03-02 10:53 (UTC) - Expand

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-02 11:15 (UTC) - Expand

(no subject)

2011-03-01 18:04 (UTC)
Posted by [identity profile] janatem.livejournal.com
Это задача из серии «угадай, что угадать надо»?
Там есть ссылки на страницы, содержащие «переводы» предложений на английский.

(no subject)

2011-03-01 19:21 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Хуже того — неизвестно даже, надо или не надо.

(no subject)

2011-03-01 18:22 (UTC)
Posted by [identity profile] slobin.livejournal.com
Единственное осмысленное обсуждение загадки мне удалось найти здесь. Остальные десятки тысяч ссылок -- роботы, ворующие контент друг у друга. Подозреваю, они и были целевой аудиторией.

... The hinge of armoring is important internal source ...

(no subject)

2011-03-01 19:23 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Я бы не стал столько трудиться, чтобы роботов подивить, чесслово! Думаю, смысл должен быть.

(no subject)

2011-03-01 18:36 (UTC)
Posted by [identity profile] aamonster.livejournal.com
Не знаю, что это, но подмывает сделать такую бяку:

1. Берём текст на английском, считаем условные вероятности символов в двухбуквенном контексте (типа вероятности буквы "р" после букв "ве").
2. Генерим по этим вероятностям текст (первые две буквы случайно, третью - случайно по вероятностям из пункта 1 и так далее).
3. Выкидываем из полученного текста все английские слова.

Таким образом, звучать будет похоже на английский - но без известных слов.

(no subject)

2011-03-01 19:23 (UTC)
Posted by [identity profile] fregimus.livejournal.com
И зачем мы все это проделываем?

(no subject)

Posted by [identity profile] aamonster.livejournal.com - 2011-03-01 19:36 (UTC) - Expand

(no subject)

2011-03-02 06:22 (UTC)
Posted by [identity profile] thedeemon.livejournal.com
X правам, один на всем со императорал, успокинулот няня, в двсхохобнони уже зноор а -- сам при опять увидания. Она гаре работу. Прикрапул сон может и они на только и люди руки, с занимавшихся как мы и вместо
" * Еidеъм -- болезнени mouqо Денисов, стар, чески юбк -- Adieu!"‘вимы, Знай слащушух звуки часов утросислю, р зная москулимис.т,и они прават была тя-путешеством, то партилет подле зимы и гора Ростов. Иппейший сказав от, говору но несколько жалечу.
-- Это живодумаю, что высокий и любовна первого до награжхо-коврина, и все обальное лицо его ноги балос-с петь про коротому, видимо, но завом особа одни позицию было пробовались об объехал позавтра не обращаясь ко-молчал, повать про мег вдуматом (он гостей, граф, то подробно свидание врейназом худых я страстное от лучистых, приехал в люди вопросы схоя. бывает п'ишке гору.

http://www.rsdn.ru/forum/alg/3628187.aspx

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-02 07:09 (UTC) - Expand

(no subject)

Posted by [identity profile] antihydrogen.livejournal.com - 2011-03-02 09:40 (UTC) - Expand

(no subject)

2011-03-01 19:12 (UTC)
spamsink: (Default)
Posted by [personal profile] spamsink
Я бы предположил, что слова выбираются случайно из всего корпуса интернета - поэтому повторения хоть и есть, но их мало, а используются ради значений конкретных байтов (или битов) своих хешей (CRC32, MD5, SHA*, да мало ли их). Вычислив известные хеши и выбрав из них нужные биты, получим исходный стеганографированный текст.

(no subject)

2011-03-01 19:24 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Но разгадать-то его в таком случае нельзя. Это было бы ужасно неинтересно.

(no subject)

Posted by [personal profile] spamsink - 2011-03-01 19:35 (UTC) - Expand

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-01 19:40 (UTC) - Expand

(no subject)

Posted by [identity profile] aamonster.livejournal.com - 2011-03-01 19:40 (UTC) - Expand

(no subject)

2011-03-01 19:48 (UTC)
Posted by [identity profile] aamonster.livejournal.com
Кстати, исходя из тех же баннеров видим, что "перевод" - не просто замена слов. В первой строке почти наверняка Automatik означает Machine - т.е. слова переставлены. А в последней вообще разное количество слов.

(no subject)

Posted by [identity profile] iad.livejournal.com - 2011-03-01 20:43 (UTC) - Expand

(no subject)

Posted by [identity profile] aamonster.livejournal.com - 2011-03-01 21:31 (UTC) - Expand

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-02 02:28 (UTC) - Expand

(no subject)

Posted by [identity profile] iad.livejournal.com - 2011-03-02 05:21 (UTC) - Expand

(no subject)

Posted by [identity profile] slobin.livejournal.com - 2011-03-02 12:23 (UTC) - Expand

(no subject)

Posted by [identity profile] fregimus.livejournal.com - 2011-03-02 13:01 (UTC) - Expand

(no subject)

2011-03-01 20:45 (UTC)
Posted by [identity profile] met0.livejournal.com
Новый синтетический язык? :) Помнится, в моем детстве по телевидению шел спектакль о том, как молодой человек выучил неизвестный ему язык, пользуясь услугами безумного преподавателя, который потом исчез. И юноша никак не мог найти, что это был за язык, пока не столкнулся с человеком, который тоже его знал. Он выучил его по самоучителю с оторванными обложкой и первыми страницами.

(no subject)

2011-03-02 02:29 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Отличный сюжет!

(no subject)

Posted by [identity profile] antihydrogen.livejournal.com - 2011-03-02 09:48 (UTC) - Expand

(no subject)

2011-03-01 21:16 (UTC)
Posted by [identity profile] sepulkarium.livejournal.com
Там снизу адрес указан: info@translatish.com
Можно написать гневное письмо

(no subject)

2011-03-02 02:30 (UTC)
Posted by [identity profile] fregimus.livejournal.com
На каком языке?

(no subject)

2011-03-02 02:24 (UTC)
Posted by [identity profile] goth-tucha.livejournal.com
Похоже на дизайнерскую "рыбу" а-ля Lorem Ipsum. Может быть сайт в разработке?

(no subject)

Posted by [identity profile] goth-tucha.livejournal.com - 2011-03-02 07:45 (UTC) - Expand

(no subject)

2011-03-02 08:37 (UTC)
Posted by [identity profile] abzac-kakoj-to.livejournal.com
1. Когда люди ищут что-то в гугле, они иногда опечатываются
2. При этом с ненулевой вероятностью получаются такие слова
3. При этом они попадают на этот сайт
....
5. Profit

(no subject)

2011-03-02 09:36 (UTC)
Posted by [identity profile] fregimus.livejournal.com
А какой от попадания на сайт профит? По-моему, расход один. Один мегабайт — двадцать копеек, пять мегабайт — рубль…

(no subject)

Posted by [identity profile] abzac-kakoj-to.livejournal.com - 2011-03-02 10:21 (UTC) - Expand

(no subject)

Posted by [identity profile] slobin.livejournal.com - 2011-03-02 12:16 (UTC) - Expand

(no subject)

2011-03-02 10:24 (UTC)
Posted by [identity profile] afuchs.livejournal.com
Там, как заметили выше - множество слов из известных языков (нем., англ., франц., галл.); я думаю, это орфографические и каким-то образом синтаксические анаграммы. Т.е. взяли много переводов на разные языки, например, с гугла, и каким-то более или менее хитрым скремблером их перемешали, да так, чтобы распространённые статистические системы распознавания языков показывали высокую информативность (или как это там называется).

(no subject)

2011-03-02 11:14 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Они ее как раз не показывают. Закон Ципфа очевидно не выполняется для этих текстов.