Перейти до вмісту

Мова і статистика


Повідомлень в темі: 15

#1 Гетьман

    I am forsaken (c) Sylvanas

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 2480 повідомлень
  • Стать:Чоловік
  • Місто:Leopolis novus

Відправлено 17.08.2009 – 16:09

  • 15
Вельми часто можна на форумі спостерігати за вживанням багатьма форумлянами статистичних даних і в той же час їхня словесна оцінка. Якщо у статистиці є доволі чіткі числа, наприклад, три достовірні імовірності - 95%, 99%, 99,9%, то при переведенні цього у слова - виникає проблема. Все-таки не будеш у повсякденній мові вживати: "У 94% випадків люди, що хоч раз їздили на фунікулерах, знають хто такий Черновецький", а скажеш: "Майже всі люди, що хоч раз їздили на фунікулерах, знають, хто такий Черновецький". Але, як відомо, у слова кожен вкладає своє значення. В той же ж час, як частота визначається за строгою формулою: частота=(кількість потрібних випадків/кількість загальних випадків)*100%. Виникає проблема переведення слів у числа. Звісно, числа будуть не точні, а так звані інтервали довіри. Наприклад:
більшість = (50%;100%], що означає те, що більшість - це число більше за 50%, але не більше за 100%.
Але виникає проблема із іншими словами, які доволі розпливчасті. Наприклад, "інколи", "швидше за все", "часто", "можливо" і т. д.
Словом, пропоную обговорити тему.
Власна спроба якось "оцифрувати" відомі слова:
більшість = (50%;100%]
завжди = 100%
майже завжди = (95%;100%]
ніколи = 0%
практично неможливо = [0%,0,1%)
З. І. До модераторів: якщо тема зацікавить користувачів, варто було б зафіксувати перший допис із таблицею, яку я спробував почати на власний розсуд, оновлюючи її за потреби (обговорення).

#2 Немі

    т-зло, т-дурепа, т-невдаха, т-піся, т-ононіміст. я звьозда.

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 2559 повідомлень
  • Стать:Жінка
  • Місто:Олімп

Відправлено 17.08.2009 – 16:35

Більша половина рулить, ги)
А серйозно: про 96% можна сказати "майже всі", а про 98% - більшість (за пана роздумами) і принаймні теоретично помилки не буде. Тільки інші асоціації викликають, якщо не уточнити число. Натомість при 0,1% слово "неможливо" у прямому значенні цього слова не підходить. І автоматично - 0% це одночасно "ніколи" і "практично неможливо" (перепрошую, що знову чіпляюсь, але тут теж нафіга слово "практично"?) І те саме щодо 100%.
А тепер моє інфантильне запитання - не простіше подавати число, а інші слова на свій розсуд?)
При звичайнісінькій НЕ офіційній розмові так і відбувається, все "більш-менш/приблизно" та більшого значення точне число не має. При офіційній розмові числа - обов'язкові, слова цього типу, нібито, можуть бути, але переважно вони зайві, інколи навіть шкодять.
  • 0

#3 Nomad

    Старійшина

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3581 повідомлень

Відправлено 17.08.2009 – 17:09

Теорія ймовірності каже шо будь яка подія можлива, тіки її ймовірність настання може бути мізерною.
На рахунок мовних аналогів статистичних оцінок - в принципі всі наведені вище приклади є тривіальними, і в принципі ними користуються багато людей, навіть і підсвідомо. Навіщо наводити ще якісь паралелі не розумію, мова є мова, а статистика є статистика.
  • 0

#4 FT232BM

    私は人々嫌い

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3435 повідомлень
  • Стать:Чоловік
  • Місто:Київ->НТУУ "КПІ"

Відправлено 17.08.2009 – 17:35

Числа саме для цього створені, шоб голову собі не морочити, а ви таке кощунство пропонуєте)) Хоча якщо писати про числа взагалі то деякі числа всетаки намагались виразити словесно: 1,2,3(ше не знаю як, скоріш за все у якійсь мові є його словесна інтерпритація),12,13. Але то пережиток минулого.
  • 0

#5 Katod

    вєтєран

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3642 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 18.08.2009 – 12:54

Перегляд дописуГетьман (17.08.2009 17:09) писав:

Вельми часто можна на форумі спостерігати за вживанням багатьма форумлянами статистичних даних і в той же час їхня словесна оцінка. Якщо у статистиці є доволі чіткі числа, наприклад, три достовірні імовірності - 95%, 99%, 99,9%, то при переведенні цього у слова - виникає проблема. Все-таки не будеш у повсякденній мові вживати: "У 94% випадків люди, що хоч раз їздили на фунікулерах, знають хто такий Черновецький", а скажеш: "Майже всі люди, що хоч раз їздили на фунікулерах, знають, хто такий Черновецький". Але, як відомо, у слова кожен вкладає своє значення. В той же ж час, як частота визначається за строгою формулою: частота=(кількість потрібних випадків/кількість загальних випадків)*100%. Виникає проблема переведення слів у числа. Звісно, числа будуть не точні, а так звані інтервали довіри. Наприклад:
більшість = (50%;100%], що означає те, що більшість - це число більше за 50%, але не більше за 100%.
Але виникає проблема із іншими словами, які доволі розпливчасті. Наприклад, "інколи", "швидше за все", "часто", "можливо" і т. д.
Словом, пропоную обговорити тему.
Власна спроба якось "оцифрувати" відомі слова:
більшість = (50%;100%]
завжди = 100%
майже завжди = (95%;100%]
ніколи = 0%
практично неможливо = [0%,0,1%)
З. І. До модераторів: якщо тема зацікавить користувачів, варто було б зафіксувати перший допис із таблицею, яку я спробував почати на власний розсуд, оновлюючи її за потреби (обговорення).
я знаю, ти крутий математик, от можеш сказати, свідки в задачі про падіння голки на рівновіддалені паралельні прямі вилазить число Пі?


питаю, бо невторопав зпершого разу
  • 0

#6 zav

    зрадник

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 9565 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 18.08.2009 – 13:11

Перегляд дописуГетьман (17.08.2009 17:09) писав:

у статистиці є доволі чіткі числа, наприклад, три достовірні імовірності - 95%, 99%, 99,9%
Я би привчив людей до цих сіґм й нормальОК.
  • 0

#7 FT232BM

    私は人々嫌い

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3435 повідомлень
  • Стать:Чоловік
  • Місто:Київ->НТУУ "КПІ"

Відправлено 18.08.2009 – 13:47

Цитата

у статистиці є доволі чіткі числа, наприклад, три достовірні імовірності - 95%, 99%, 99,9%
Ці числа глибокої суті, навідміну від Пі і числа Ейлера глибокої суті не несуть, вони просто практично вигідні для розрахунків.
  • 0

#8 Гетьман

    I am forsaken (c) Sylvanas

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 2480 повідомлень
  • Стать:Чоловік
  • Місто:Leopolis novus

Відправлено 18.08.2009 – 14:42

Перегляд дописуNеmesis (17.08.2009 17:35) писав:

Більша половина рулить, ги)
А серйозно: про 96% можна сказати "майже всі", а про 98% - більшість (за пана роздумами) і принаймні теоретично помилки не буде. Тільки інші асоціації викликають, якщо не уточнити число. Натомість при 0,1% слово "неможливо" у прямому значенні цього слова не підходить. І автоматично - 0% це одночасно "ніколи" і "практично неможливо" (перепрошую, що знову чіпляюсь, але тут теж нафіга слово "практично"?) І те саме щодо 100%.
А тепер моє інфантильне запитання - не простіше подавати число, а інші слова на свій розсуд?)
При звичайнісінькій НЕ офіційній розмові так і відбувається, все "більш-менш/приблизно" та більшого значення точне число не має. При офіційній розмові числа - обов'язкові, слова цього типу, нібито, можуть бути, але переважно вони зайві, інколи навіть шкодять.
Звісно, що помилки не буде. Але, сказавши на 99% замість "майже всі", "більшість", можна надурити людину на чисто сприйняттєвому рівні, що часто і робиться (почитайте, наприклад, суперечки про політику тут на форумі).

Перегляд дописуKatod (18.08.2009 13:54) писав:

я знаю, ти крутий математик, от можеш сказати, свідки в задачі про падіння голки на рівновіддалені паралельні прямі вилазить число Пі?
Буду виходити із геометричної імовірності, хоча воно ще потребує обґрунтування, але це для буквоїдів. Отже, нехай відстань між прямими у нас 2d. Довжина голки нехай у нас 2l (менша за дане 2d). Голка у нас може падати на пряму під кутом aplha від 0 до Pi. Голка потрапляє на пряму тоді, коли z (координата падіння центру голки, яка змінюється від 0 до d) потрапляє у такий інтервал, що l*sin(alpha)>z. Намалювавши множину значень координат, які задовольняють дане співвідношення на полі з кутів та координат падіння центру голки, ми отримуємо геометричну імовірність попадання голки на паралельну пряму, яка рівна відношенню [інтегралу від 0 до Pi від функції (l*sin(alpha)d(alpha))]/(Pi*d)=2l/Pi*d. Згідно із законом великих чисел, при великому числі випробувань, експериментальна частота прямуватиме до імовірності, тому P (експериментальна частота)~2l/Pi*d, звідки Pi~2l/P*d.

Перегляд дописуzav (18.08.2009 14:11) писав:

Я би привчив людей до цих сіґм й нормальОК.
Звісно, що нормальок. Якщо біологів привчають - то в чому проблема привчити гуманітаріїв, гиги. Але ж не дадуться

Перегляд дописуFT232BM (18.08.2009 14:47) писав:

Ці числа глибокої суті, навідміну від Пі і числа Ейлера глибокої суті не несуть, вони просто практично вигідні для розрахунків.
Зате їхні квантилі є похідними від вищезгаданих e та Pi.
  • 0

#9 Katod

    вєтєран

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3642 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 18.08.2009 – 22:23

Перегляд дописуFT232BM (18.08.2009 14:47) писав:

Ці числа глибокої суті, навідміну від Пі і числа Ейлера глибокої суті не несуть, вони просто практично вигідні для розрахунків.
:angry12:
ну, таваріщ точняк, скажу вам Шейм он ю, взяти всі розділи фізики в яких фігурує рівняння шредігенгера, яке являється оперує густиною ймовірності
взагалі, теорія ймовірності точна наука
  • 0

#10 Katod

    вєтєран

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3642 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 18.08.2009 – 22:59

а, взагалі, мова ж про статистику а не про теорію ймовірності, щось я тму не зблизька глянуві давай розказувати

так статистика, це ж така штука, так би мовити перевірена, є ймовірність того що щось відбудеться, а є статистика, що щось відбувається, і з цим просто, є якась підія, і варіанти виходу цієї події, причому, мова йдеться про те що відбулося

звичайно є статистична фізика, але методи статистичної фізики, як мінімум вони використовуються в термодинамці, і ще, де хочеш, в тій самій ядерній фізиці, на кафедрі молекулярної фізики дуже сильно люблять вивчати еволюцію систем, але це менші нагадує статистику яку використовують в телевізорі
вся штука в тому, що в статистичній фізиці наперед задані взаємодії, кількість ступенів вільності, а в людях, як визначиш потенціали і стіпені вільності? ніхто ж цим не займався(може і займався, але нам не каже), точняки не дуже любять лізти в соціум, де працюють гуманітарії в основному, хоча методи прогнозування напевне викрористовуються пов"язані з розподілами...
щось я розтікся

одним словом обшибся,
статистика показує розподіл чогось від ще чогось, і тут досить все точно, якщо звичайно це не взято з стелі
  • 0

#11 FT232BM

    私は人々嫌い

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3435 повідомлень
  • Стать:Чоловік
  • Місто:Київ->НТУУ "КПІ"

Відправлено 18.08.2009 – 23:20

Перегляд дописуKatod (18.08.2009 23:23) писав:

:angry12:
ну, таваріщ точняк, скажу вам Шейм он ю, взяти всі розділи фізики в яких фігурує рівняння шредігенгера, яке являється оперує густиною ймовірності
взагалі, теорія ймовірності точна наука
Нєнєнє якраз не точна. Я зустрічав 95% наприклад, не будемо далеко лізти, в таблиці Стьюдента, і ті 95% якраз і є точністю яку забезпечують приведені коефіцієнти, на скільки я зрозумів. А взято число чисто з раціональних міркувань.
Хоч мушу визнати я не сильний в даній царині(статистика). Так, освоїв кілька алгоритмів.
  • 0

#12 Kassandra

    Т-Сонятко

  • СуперМодератори
  • PipPipPipPipPipPipPipPipPipPip
  • 5187 повідомлень
  • Стать:Жінка
  • Місто:сплячих левів

Відправлено 18.08.2009 – 23:36

тю, я думала тема про статлінгвістику а тут просто зачіпається стилістика з статистикою..нецікаво..

Цитата

Я зустрічав 95% наприклад, не будемо далеко лізти, в таблиці Стьюдента, і ті 95% якраз і є точністю яку забезпечують приведені коефіцієнти, на скільки я зрозумів.
в таблиці Стьюдента якраз є три довірчих рівні - 95%,99% і 99,9% .
  • 0

#13 Katod

    вєтєран

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3642 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 19.08.2009 – 09:08

Перегляд дописуKassandra (19.08.2009 00:36) писав:

тю, я думала тема про статлінгвістику а тут просто зачіпається стилістика з статистикою..нецікаво..

в таблиці Стьюдента якраз є три довірчих рівні - 95%,99% і 99,9% .
так хто ж заважає вести мову про статлінгвістику, от я незнаю що це таке, можу тільки уявити, що це гелузь лінгвістики, що розглядає еволюцію системи слів, а може і не так
Бач, тут кожен знайомий з статистикою зі свого боку
  • 0

#14 Katod

    вєтєран

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3642 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 19.08.2009 – 11:49

Перегляд дописуFT232BM (19.08.2009 00:20) писав:

Нєнєнє якраз не точна. Я зустрічав 95% наприклад, не будемо далеко лізти, в таблиці Стьюдента, і ті 95% якраз і є точністю яку забезпечують приведені коефіцієнти, на скільки я зрозумів. А взято число чисто з раціональних міркувань.
Хоч мушу визнати я не сильний в даній царині(статистика). Так, освоїв кілька алгоритмів.
а там переплутав з теорією ймовірності, і нічого не казав про аоофіцієнти Ед"юкейшена:angry12:
  • 0

#15 FT232BM

    私は人々嫌い

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3435 повідомлень
  • Стать:Чоловік
  • Місто:Київ->НТУУ "КПІ"

Відправлено 19.08.2009 – 12:34

Перегляд дописуKatod (19.08.2009 12:49) писав:

а там переплутав з теорією ймовірності, і нічого не казав про аоофіцієнти Ед"юкейшена:angry12:
Так і знав, краще не сперечатись з цими хвізиками та математиками хфєєє))
  • 0

#16 Katod

    вєтєран

  • Користувачі
  • PipPipPipPipPipPipPipPipPipPip
  • 3642 повідомлень
  • Стать:Чоловік
  • Місто:Київ

Відправлено 19.08.2009 – 13:07

Перегляд дописуFT232BM (19.08.2009 13:34) писав:

Так і знав, краще не сперечатись з цими хвізиками та математиками хфєєє))
:angry12:
і це добре, бо я ж міг коофіцієнти Стьюдента переплутати з парметрами Стокса:ggggg:
  • 0



Кількість користувачів, що читають цю тему: 1

0 користувачів, 1 гостей, 0 анонімних