О мексиканцах

Хорошие парни — мексиканцы. Трудолюбивые и неприхотливые. С радостью строили они дома, жарили буритос и делали другую неблагодарную работу северному соседу. За мелкий прайс, да и просто из любви к искусству. Но когда сделали они свое трудное дело, Дональд Фредович решил выгнать их, обязав напоследок построить за собой стену за собственный счет. С аргументацией: «у нас есть моральное право и все инструменты для давления. Пришло время использовать их и сделать Америку великой».

И напомнило мне это отношение всяких масоно-погонных руководителей к айтишникам. Так же поначалу пустили айтишников построить информационные системы самых разных уровней и сложностей. А теперь выгоняют из бизнеса под предлогами защиты детей от бигдаты и прочих информационных войн с злыми хакерами. Конечно, некоторых формально оставляют, но уже не на ключевых направлениях, а на скромных должностях строителей а-ля китайских фаерволов вокруг зондов для населения.

И мексиканцы в этом моменте оказались гораздо круче айтишников. Вместо того, чтобы переобуваться, как делают допущенные поводить хоровод у корня вертикали власти представители высокотехнологичной отрасли, мексиканцы прямо говорят — а не пошел ли Дональд Фредович.

Торговые роботы

Дающие советы инвесторам компьютерные программы (робо-эдвайзеры) несут угрозу, считает первый зампред ЦБ. Появление на рынке большого числа игроков с одинаковыми инвестиционными идеями может привести к катастрофе.

Подробнее на РБК: http://www.rbc.ru/finances/17/02/2016/56c42ecf9a79473791cb0ada

rob

Иногда, глядя как большие парни рассуждают о безопасности, по полету их мысли можно догадаться куда стоит копать. Так и в этом случае.

Какое, казалось бы, дело регулятору, если участник рынка рискует своими средствами? Это же свободное предпринимательство на ниве капитала. Или может не совсем свободное? Может методики, которыми пользуются большие парни для шевеления рынка не должны быть доступны простым смердам, пытающимся на этом рынке подзаработать на хлеб насущный?

Фондовый рынок — занятная штука. Иногда от нечего делать я его считаю на разных модельках. Например лет 10 назад я его пытался скрутить с новостями. Котировки тысяч позиций из многих источников соотносил с n-грамами из сотен новостных потоков. И знаете, что?

Есть закономерности и зависимости. Но обратные. Сначала шевелится биржа, а потом выходит новость. То есть по потоку котировок можно примерно предсказать в какой отрасли выйдет новость. А по амилитуде отклонения от фона — насколько значимой будет та новость. Не более того. Все новости на момент выхода уже в рынке. Да это и так любой торговец знает. (Погода, кстати, тоже в рынке, все тысячи метеостанций с открытыми данными. Сначала биржа шевелится, потом погода меняется, а синоптики с хорошими прогнозами неплохо зарабатывают, но для тех моделей нужны вычислительные мощности).

Но вот мэйкеры новостных поводов тоже не столь просты. Там нет хаоса, там есть некая модель, отражающая долговременные стратегии больших парней. Да нелинейная, не первого порядка, некоторые размерности ее не очень действительны и поэтому сложновычислимы с публичным бытовым матаппаратом. Но модель есть. А значит ее можно интерполировать и экстраполировать чуть более сложной моделью.

Но сегодня не тот день, чтобы такой ерундой заниматься. Сегодня (да и всегда последнее время) день холодильника: https://uncheckorg.wordpress.com/2016/02/03/xolodilnik-i-fsb/

Я щетаю это офигенно

Когда РосПравосудие только запускалось, некоторые сотрудники одной из СПС нелестно отзывались о новом проекте:

pravo_ru

Теперь все выглядит немного не так:

Снимок экрана 2016-02-09 в 21.39.21

Одна из СПС скупает яндекс-директ по запросу «росправосудие», ибо:

Снимок экрана 2016-02-09 в 21.45.05

Снимок экрана 2016-02-09 в 21.44.42

Но, к сожалению, вынужден констатировать, что встречаются и не столь отрадные случаи злоупотребления словом «росправосудие», которые мне, как слесарю по ремонту холодильного оборудования, прискорбно наблюдать.

Движок базы данных

На сайте РосПравосудие используется несколько движков базы данных. Это MySQL для хранения «медленных» данных, Sphinx для организации полнотекстового поиска и самодельный специализированный движок для быстрых выборок.

Скорость работы самописного движка на момент запуска РосПравосудия была быстрее MySQL. Движок был пару раз переписан, и скорость выросла на пару порядков. Характеристики на сей день составляют (над 80 миллионами записей):

  • Время выполнения произвольного запроса (любой набор условий where, group, order) от 1 до 100 милисекунд.
  • Среднее время выполнения запроса 12 милисекунд.
  • Доступно параллельное выполнение запросов.
  • Динамическое обновление данных.

Теоретически данные показатели должны сохраняться при масштабировании объема данных на порядок-другой. Но российские суды еще не скоро выложат столько решений. Поэтому, если у вас есть миллиард и больше единиц данных, над которыми нужны многочисленные, произвольные и быстрые выборки, то пишите на [email protected] , подумаем как их обработать.

Стена

А что будет если распечатать все решения из РосПравосудия?

На сей день в базе 33+ миллиона решений. В среднем решение помещается на 3 страницах формата A4. 100 миллионов страниц.

Пачка бумаги содержит 500 листов. 100000000 / 500 = 200000. Двести тысяч пачек бумаги. Весит такое количество бумаги 500 тонн. Для ее перевозки потребны восемь ЖД вагонов.

Из этих пачек бумаги можно сложить стену высотой 3 метра и длиной километр. Этой стеной можно огородить участок площадью 6 гектаров.

РосПравосудие — правосудие для людей

Запилил тут на досуге аналитический сервисок над Российской судебной системой. Над всеми её судами, судьями, адвокатами, статьями и приговорами. Вот что получилось:

РосПравосудие — правосудие для людей.

С помощью оного можно непринужденно делать, например такие вещи:

Криминальная карта России

Суды города Омска и Омской области

Арбитражный Суд Омской области
Кировский районный суд г. Омска
Ленинский районный суд г. Омска
Куйбышевский районный суд г. Омска
Первомайский районный суд г. Омска
Центральный районный суд г. Омска
Октябрьский районный суд г. Омска
Советский районный суд г. Омска
Омский районный суд Омской области

РИА-Аналитика и Росстат — наркоманы

РИА-Аналитика обколовшись анашой проанализировало данные Росстата и пришло к странному выводу о том что «Омичи пользуются интернетом больше всех в Сибири«. Вывод весьма удивительный ибо общеизвестно, что на самом деле Омичи пользуются не интернетом а веществами.

Собственноручно проведенное соотнесение статистики посетителей за 7 дней от LiveInternet и данных о населении регионов на 2010 год показывает ожидаемую обратную картину. Омская область занимает подобающее ей 27 место уступая по доле вовлечения населения в интернет сибирским регионам: Novosibirsk, Khabarovsk, Tomsk, Krasnoyarsk, Irkutsk и даже Surgut.

Интересно сколько Лелик занес в Росстат чтобы считаться главой самого инновационного региона сибири?

регион счетчик население
Moscow 11025115 17315.7 0.64
Saint-Petersburg 3849724 6229.9 0.62
Novosibirsk 1563636 2649.9 0.59
Khabarovsk 650257 1400.4 0.46
Krasnodar 2314212 5160.7 0.45
Ulyanovsk 560109 1298.6 0.43
Nizhni Novgorod 1398972 3323.6 0.42
Ekaterinburg 1783106 4393.8 0.41
Samara 1145266 3170.1 0.36
Tomsk 366723 1043.8 0.35
Ryazan 397147 1151.4 0.34
Vladivostok 675707 1982 0.34
Kaliningrad 243227 937.9 0.26
Krasnoyarsk 732938 2893.9 0.25
Saratov 640624 2564.8 0.25
Tolyatti 172935 719 0.24
Chelyabinsk 834717 3508.4 0.24
Murmansk 198124 836.7 0.24
Petrozavodsk 153879 684.2 0.22
Rostov-on-Don 950512 4229.5 0.22
Irkutsk 553113 2502.7 0.22
Perm 589865 2701.2 0.22
Kazan 792443 3778.5 0.21
Surgut 319415 1538.6 0.21
Voronezh 460368 2261.6 0.20
Omsk 389428 2012.1 0.19
Syktyvkar 178730 951.2 0.19
Izhevsk 271131 1526.3 0.18
Yaroslavl 217060 1306.3 0.17
Ufa 673565 4066 0.17
Novgorod 105693 640.6 0.16
Kaluga 163956 1001.6 0.16
Volgograd 421975 2589.9 0.16
Cheboksary 206148 1278.4 0.16
Stavropol 431389 2711.2 0.16
Arkhangelsk 199489 1254.4 0.16
Lipetsk 176435 1157.9 0.15
Kemerovo 422661 2820.6 0.15
Pskov 100630 688.6 0.15
Vologda 175506 1213.7 0.14
Orel 116172 812.5 0.14
Ioshkar Ola 99597 698.2 0.14
Kirov 195203 1391.1 0.14
Penza 192541 1373.2 0.14
Salekhard 76312 546.5 0.14
Tula 213921 1540.4 0.14
Ivanovo 147998 1066.5 0.14
Yuzhno-Sakhalinsk 70528 510.8 0.14
Kostroma 94663 688.3 0.14
Kurgan 127168 947.6 0.13
Vladimir 188554 1430.1 0.13
Belgorod 200213 1530.1 0.13
Barnaul 320492 2490.7 0.13
Kursk 147214 1148.6 0.13
Tver 168174 1360.3 0.12
Orenburg 258743 2112.9 0.12
Tambov 128857 1088.4 0.12
Bryansk 151708 1292.1 0.12
Saransk 96683 826.5 0.12
Smolensk 110962 966 0.11
Vladikavkaz 76449 700.9 0.11
Abakan 54108 539.2 0.10
Astrakhan 94519 1007.1 0.09
Petropavlovsk-Kamchatski 30006 342.2 0.09
Tyumen 294556 3430.3 0.09
Chita 93713 1117 0.08
Blagoveshchensk 60556 860.7 0.07
Ulan-Ude 66259 963.5 0.07
Biribidzhan 10830 185 0.06
Nalchik 51729 893.8 0.06
Maikop 23921 443.2 0.05
Magadan 8528 161.2 0.05
Cherkessk 22013 427 0.05
Gorno-Altaisk 10619 210.7 0.05
Elista 13406 283.2 0.05
Yakutsk 44053 949.3 0.05
Anadyr 1700 48.6 0.03
Naberezhnye Chelny 109845 3778.5 0.03
Makhachkala 73020 2737.3 0.03
Kyzyl 5320 317.1 0.02
Nazran 4281 516.7 0.01
Groznyy 9095 1268 0.01

регион счетчик население
Moscow 11025115 17315.7 0.64
Saint-Petersburg 3849724 6229.9 0.62
Novosibirsk 1563636 2649.9 0.59
Khabarovsk 650257 1400.4 0.46
Krasnodar 2314212 5160.7 0.45
Ulyanovsk 560109 1298.6 0.43
Nizhni Novgorod 1398972 3323.6 0.42
Ekaterinburg 1783106 4393.8 0.41
Samara 1145266 3170.1 0.36
Tomsk 366723 1043.8 0.35
Ryazan 397147 1151.4 0.34
Vladivostok 675707 1982 0.34
Kaliningrad 243227 937.9 0.26
Krasnoyarsk 732938 2893.9 0.25
Saratov 640624 2564.8 0.25
Tolyatti 172935 719 0.24
Chelyabinsk 834717 3508.4 0.24
Murmansk 198124 836.7 0.24
Petrozavodsk 153879 684.2 0.22
Rostov-on-Don 950512 4229.5 0.22
Irkutsk 553113 2502.7 0.22
Perm 589865 2701.2 0.22
Kazan 792443 3778.5 0.21
Surgut 319415 1538.6 0.21
Voronezh 460368 2261.6 0.20
Omsk 389428 2012.1 0.19
Syktyvkar 178730 951.2 0.19
Izhevsk 271131 1526.3 0.18
Yaroslavl 217060 1306.3 0.17
Ufa 673565 4066 0.17
Novgorod 105693 640.6 0.16
Kaluga 163956 1001.6 0.16
Volgograd 421975 2589.9 0.16
Cheboksary 206148 1278.4 0.16
Stavropol 431389 2711.2 0.16
Arkhangelsk 199489 1254.4 0.16
Lipetsk 176435 1157.9 0.15
Kemerovo 422661 2820.6 0.15
Pskov 100630 688.6 0.15
Vologda 175506 1213.7 0.14
Orel 116172 812.5 0.14
Ioshkar Ola 99597 698.2 0.14
Kirov 195203 1391.1 0.14
Penza 192541 1373.2 0.14
Salekhard 76312 546.5 0.14
Tula 213921 1540.4 0.14
Ivanovo 147998 1066.5 0.14
Yuzhno-Sakhalinsk 70528 510.8 0.14
Kostroma 94663 688.3 0.14
Kurgan 127168 947.6 0.13
Vladimir 188554 1430.1 0.13
Belgorod 200213 1530.1 0.13
Barnaul 320492 2490.7 0.13
Kursk 147214 1148.6 0.13
Tver 168174 1360.3 0.12
Orenburg 258743 2112.9 0.12
Tambov 128857 1088.4 0.12
Bryansk 151708 1292.1 0.12
Saransk 96683 826.5 0.12
Smolensk 110962 966 0.11
Vladikavkaz 76449 700.9 0.11
Abakan 54108 539.2 0.10
Astrakhan 94519 1007.1 0.09
Petropavlovsk-Kamchatski 30006 342.2 0.09
Tyumen 294556 3430.3 0.09
Chita 93713 1117 0.08
Blagoveshchensk 60556 860.7 0.07
Ulan-Ude 66259 963.5 0.07
Biribidzhan 10830 185 0.06
Nalchik 51729 893.8 0.06
Maikop 23921 443.2 0.05
Magadan 8528 161.2 0.05
Cherkessk 22013 427 0.05
Gorno-Altaisk 10619 210.7 0.05
Elista 13406 283.2 0.05
Yakutsk 44053 949.3 0.05
Anadyr 1700 48.6 0.03
Naberezhnye Chelny 109845 3778.5 0.03
Makhachkala 73020 2737.3 0.03
Kyzyl 5320 317.1 0.02
Nazran 4281 516.7 0.01
Groznyy 9095 1268 0.01

Удачливые истцы

Чем больше число во второй колонке таблицы, тем больше шансов у людей с окончанием фамилии из первой колонки выиграть иск в Российском суде. Учтенное количество исков и примеры фамилий в третьей колонке. Данные получены путем анализа решений судов РФ по гражданским делам за один месяц опубликованным на сайте sudrf.ru.

Статистически достоверно можно заметить что женщины выигрывают иски чаще на 2-3% случаев чем мужчины.

Для дальнейшего исследования планируется улучшить семантический анализатор текстов дел, что позволит вытащить из массива информации еще больше фамилий истцов, а также собрать данные по фамилиям ответчиков.

ак 58 [62]Ооржак(4),Рыбак(4),Пак(3),Литвак(2),Чолак(2)
ль 62 [66]Коваль(5),Циттель(2),Соболь(2),Шепель(2),Вигуль(2)
инов 64 [110]Логинов(14),Константинов(6),Литвинов(6),Татаринов(6),Савинов(5)
ых 66 [101]Черных(13),Фоминых(6),Косых(5),Белых(5),Малых(5)
ый 68 [54]Письменный(3),Черный(2),Нагорный(2),Лютый(2),Артельный(1)
динова 68 [72]Шайхутдинова(4),Шамсутдинова(4),Дудинова(3),Хуснутдинова(3),Кудинова(3)
ич 68 [177]Матусевич(3),Касперович(2),Зубович(2),Леонович(2),Маркевич(2)
ик 70 [152]Олейник(10),Кулик(5),Калашник(4),Колесник(3),Мельник(3)
ая 70 [491]Вербицкая(7),Быковская(4),Полянская(4),Минская(3),Яворская(3)
динов 70 [84]Чудинов(4),Кудинов(4),Галяутдинов(3),Камальдинов(3),Хуснутдинов(3)
ер 70 [80]Миллер(6),Шефер(3),Кучер(3),Вебер(3),Шифер(2)
ец 70 [100]Истец(11),Кравец(5),Швец(4),Федорец(3),Семенец(2)
ян 71 [273]Григорян(9),Акопян(7),Арутюнян(7),Хачатрян(7),Мхитарян(4)
ев 71 [2046]Васильев(41),Алексеев(30),Киселев(26),Зайцев(26),Григорьев(25)
other 71 [1836]Фамилия(9),Токарь(7),Шульга(7),Мороз(7),Ким(7)
инова 71 [99]Логинова(10),Блинова(6),Константинова(6),Литвинова(6),Хусаинова(5)
ов 72 [5626]Иванов(89),Попов(61),Смирнов(55),Кузнецов(52),Петров(49)
ин 72 [2226]Кузьмин(21),Абдуллин(15),Никитин(14),Сорокин(13),Никулин(12)
ева 72 [2204]Васильева(48),Соловьева(31),Зайцева(29),Ковалева(29),Сергеева(25)
ко 72 [1535]Шевченко(28),Коваленко(23),Бондаренко(21),Руденко(17),Ткаченко(16)
чук 72 [96]Шевчук(6),Ковальчук(5),Паламарчук(3),Пинчук(3),Кравчук(3)
ман 72 [40]Герман(3),Эйхман(3),Русман(2),Гофман(2),Думан(2)
ий 73 [431]Островский(6),Загрядский(4),Чернявский(4),Павловский(4),Козловский(4)
ук 73 [52]Жук(5),Полищук(3),Харук(2),Гончарук(2),Гайдук(2)
ова 74 [5505]Иванова(105),Попова(65),Кузнецова(61),Петрова(39),Макарова(39)
ина 75 [2231]Никитина(33),Кузьмина(22),Калинина(19),Сорокина(16),Воронина(14)
юк 75 [114]Сердюк(5),Степанюк(4),Гребенюк(3),Семенюк(3),Михайлюк(2)
их 80 [114]Гладких(6),Доровских(4),Долгих(4),Донских(3),Русских(3)