Статистика
Содержание:
- Вычислительная статистика
- Основные элементы статистических графиков
- Некорректная интерпретация статистических исследований
- Развитие представлений о статистике
- Основные области применения статистических методов управления качеством продукции
- Понятие и виды сводки
- Разделы
- Примечания
- Краткая история статистических методов
- Связь статистики с другими дисциплинами
- Прикладная статистика
- Оптимальная численность выборки
- Крылатая фраза
Вычислительная статистика
Развитие вычислительной техники во второй половине XX века оказало значительное влияние на статистику. Ранее статистические модели были представлены преимущественно линейными моделями. Увеличение быстродействия ЭВМ и разработка соответствующих численных алгоритмов послужило причиной повышенного интереса к нелинейным моделям таким, как искусственные нейронные сети, и привело к разработке сложных статистических моделей, например обобщённая линейная модель и иерархическая модель.
Получили широкое распространение вычислительные методы, основанные на повторной выборке как критерий перестановок и бутстреппинг, наряду методы как семплирование по Гиббсу позволили более доступно использовать байесовские алгоритмы. В настоящее время существует разнообразное статистическое программное обеспечение общего и специализированного назначения.
Основные элементы статистических графиков
Классификация графиков по видам
Статистические графики – графики, назначение которых состоит в обработке и анализе количественной информации
Классификация графиков по видам:
— график наглядного изображения количественной зависимости различных массовых явлений, процессов: статистические графики, диаграммы, статистические диаграммы;
— номограммы — расчетные графики, целью которых является вычисление результатов при всевозможных комбинациях частных значений переменных, от которых этот результат зависит; номограммы являются удобным вычислительным инструментом;
— оргасхемы — структурные схемы организации предприятия; графики движения транспорта; графики-расписания работы предприятий, контрольно-плановые графики организации производства;
— диаграмма (от греч. διαγραμμα — чертеж, фигура, рисунок) представляет собой чертеж, на котором совокупности, характеризуемые определенными показателями, с целью их обобщения и анализа описываются с помощью условных геометрических образов или знаков, являющихся графическим языком.
Графический язык имеет свои специфические особенности, которые отличают его от других искусственных языков. К таким особенностям относится двухмерность записи: при передаче информации графическим языком используется два измерения — линейная последовательность размещения знаков (строка или ряд строк) и их взаимосвязь на плоскости.
Другой особенностью графического языка является непрерывность выражения, проявляющаяся в том, что информация, передаваемая с помощью графического языка, представляется посредством системы взаимосвязанных знаков, а не отдельных линейно расположенных дискретных знаков. Этим язык графиков существенным образом отличается от других искусственных языков, например, математического, для которого характерна дискретность знаков и линейная последовательность их расположения.
Еще одной особенностью графического языка является обособленность изложения. Информация, передаваемая графическим языком, обычно обособляется от непосредственно связанной с ней по содержанию информации, представленной в словесной или письменно — текстовой форме. Обособленность изложения графического языка непосредственно вытекает из его природы, его способности адекватно передавать количественные и отвлеченные качественные характеристики изучаемых явлений и выявлять из исходной информации новые свойства и особенности, находящиеся в ней в скрытом состоянии.
К особенностям графического языка также относится его метричность и наглядность. Метричность, т.е. использование в графиках масштабных шкал и условных обозначений, позволяет определить отдельные показатели, уровни и размеры изучаемых явлений. Представление информации в виде графика более наглядно и доступно, чем табличное, оно позволяет лучше осмыслить результаты наблюдения, правильно их истолковать, получить новое знание о предмете исследования, обобщая исходную информацию.
Существенной особенностью графического языка является его совместимость — легкость и гибкость объединения знаков графического языка между собой и со знаками других языковых и неязыковых знаковых систем.
Все эти особенности графического языка, являющиеся его основными признаками, раскрывают природу графического языка, что позволяет выделить его в самостоятельное, специфическое средство отображения объективной действительности.
Некорректная интерпретация статистических исследований
Бытует мнение, что данные статистических исследований всё чаще намеренно искажают или неправильно интерпретируют, выбирая только те данные, которые являются благоприятными для ведущего конкретное исследование. Неправильное использование статистических данных может быть как случайным, так и преднамеренным. В книге Даррелла Хаффа (1954) «Как лгать при помощи статистики» излагается ряд соображений по поводу использования и неправильного применения статистических данных. Некоторые авторы также проводят обзор статистических методов, используемых в определённых областях (например, Варн, Лазо, Рамос, и Риттер (2012)). Способы, позволяющие избежать неправильного толкования статистических данных включают в себя использование надлежащей схемы и исключение предвзятости при проведении исследований. Злоупотребление происходит тогда, когда такие выводы «заказываются» определёнными структурами, которые намеренно или бессознательно выводят на отбор предвзятых данных или проб. При этом гистограммы, как самый простой для использования и понимания (восприятия) вид диаграммы, могут быть сделаны либо с применением обычных программ для компьютера или просто нарисованы. Большинство людей не делают попыток искать ошибки или заблуждаются сами, поэтому и не видят ошибок. Таким образом, по мнению авторов, статистические данные, чтобы быть правдой, должны быть «не причёсаны» (то есть достоверные данные не должны выглядеть идеальными). Для того, чтобы полученные статистические данные оказались правдоподобными и точными, проба должна быть репрезентативной в целом.
Развитие представлений о статистике
Начало статистической практики относится примерно ко времени возникновения государства. Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III — II тысячелетия до н. э.).
Сначала под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 году относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение.
Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика — это бюджет вещей». Тем самым статистические методы были признаны полезными не только для административного управления, но и для применения на уровне отдельного предприятия. Согласно формулировке 1833 года, «цель статистики заключается в представлении фактов в наиболее сжатой форме». Во 2-й половине XIX — начале XX веков сформировалась научная дисциплина — математическая статистика, являющаяся частью математики.
В XX веке статистику часто рассматривают прежде всего как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных. В 1954 году академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:
- сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
- статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
- разработка приёмов статистического наблюдения и анализа статистических данных». Последний раздел, собственно, и составляет содержание математической статистики.
Термин «статистика» употребляют ещё в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценки характеристик и параметров распределений и проверки гипотез.
Основные области применения статистических методов управления качеством продукции
Рис. 1. Статистические методы управления качеством продукции
Коротко раскроем понятия, используемые на рисунке.
Статистический анализ точности и стабильности технологического процесса — это установление статистическими методами значений показателей точности и стабильности технологического процесса и определение закономерностей его протекания во времени.
Статистическое регулирование технологического процесса — это корректирование значений параметров технологического процесса по результатам выборочного контроля контролируемых параметров, осуществляемое для технологического обеспечения требуемого уровня качества продукции.
Статистический приемочный контроль качества продукции — это контроль, основанный на применении методов математической статистики для проверки соответствия качества продукции установленным требованиям и принятия продукции.
Статистический метод оценки качества продукции — это метод, при котором значения качества показателей качества продукции определяют с использованием правил математической статистики.
Термин «статистический приемочный контроль» не следует обязательно связывать с контролем готовой продукции. Статистический приемочный контроль может применяться на операциях входного контроля, на операциях контроля закупок, при операционном контроле, при контроле готовой продукции и т.д., т.е. в тех случаях, когда надо решить — принять или отклонить партию продукции.
Область применения статистических методов в задачах управления качеством продукции чрезвычайно широка и охватывает весь жизненный цикл продукции (разработку, производство, эксплуатацию, потребление и т.д.).
Статистические методы анализа и оценки качества продукции, статистические методы регулирования технологических процессов и статистические методы приемочного контроля качества продукции являются составляющими управления качеством продукции.
Понятие и виды сводки
Характеристика простой сводки
Простая сводка – это сводка, при которой осуществляется подсчёт общих итогов по всей совокупности.
Характеристика сложной сводки
Сложная сводка – комплекс операций по группировке единичных наблюдений, подсчет итогов по каждой группе и по всему объекту в целом и представлении результатов в виде статистических таблиц.
Характеристика централизованной сводки
Централизованная сводка – это такая сводка, которая проводится при единовременном статистическом наблюдении, информация сразу поступает в органы статистики.
Характеристика децентрализованной сводки
Децентрализованная сводка – это сводка, при которой информация поступает в органы государственной статистики субъектов РФ, обрабатывается там и затем передается в центральный комитет.
Метод группировок в статистике
Разделы
При входе на сайт Госстатистики пользователь видит структурированную информацию, вверху экрана есть горизонтально расположенная панель с разделами. Каждый из них подписан, и многие обладают выпадающим списком для удобства – не нужно лишний раз кликать.
Достаточно навести курсор на нужный подпункт и один раз выбрать его для перехода.
О Росстате
Это первый раздел после Главной странички, он описывает преимущества данного исполнительного органа. В шапке есть информация о том, что надежность ресурса подтверждена международной экспертизой, что становится убедительным доказательством.
Также здесь проясняется структура: государственная статистика является инструментом для решения поточных вопросов, в ее состав входит Центральный аппарат на Федеральном уровне, плюс территориальные органы Росстата, расположенные по всей стране.
Новости
В данном разделе расположены новостные ленты на актуальные тематики. Например, об объеме производства нефтепродуктов: сколько они стоят для потребителя в июле 2019 года. Затрагиваются темы о социально-экономическом положении России в период первой половины этого года.
Для совершенствования новостной странички разработчики внедрили в нее дополнительно Анонсы и Официальные мероприятия. Это актуально и удобно, когда можно быстро находить подобного рода информацию. Здесь же размещаются фото и видео отчеты с различных официальных мероприятий.
Официальная статистика
Она предоставлена касательно следующих тематик:
- О национальных счетах;
- Вопросы населения;
- Трудовой рынок, его нюансы, зарплата;
- Предпринимательская деятельность.;
- Эффективность Российской экономики;
- Государственные дела, организации, основанные на общественном укладе;
- Цены;
- Окружающая среда.
Помимо прочего, здесь есть базы данных, где указана полезная информация о каждой из них.
Для респондентов
Этот раздел предназначен для респондентов и их основной деятельности. Здесь есть формы наблюдения за статистическими изменениями, а также – отчетов в финансах. Для самых организованных пользователей имеется статкалендарь и электронная версия отчетности.
Пункт «Общероссийские и ведомственные Классификаторы» пригодится индивидуальным предпринимателям и организациям с юридическим лицом, так как этим компаниям необходимо иметь доступ к сведениям о шифрах в разных Классификаторах. Цифры оттуда помогут быстрее заполнить необходимые бумаги или подать заявление с актуальными данными.
Госзакупки
Здесь есть перечень:
- «Конкурсы», где изложены недавние мероприятия, а также размещены извещения о проведении конкурсов в электронном формате;
- Об аукционах – списки текущих и проведенных закупках;
- Ряд незаполненных подзаголовков;
- Приказы о контрактных службах;
- Список членов комиссий, осуществляющих закупки;
- Перечень нормальных документов. Это Приказы Росстата и Федеральные законы;
- Информация о госзакупках, производимых территориальными органами Росстата;
- Статистические данные об осуществлении закупок;
- Контрактные сведения (Росстата с физическими лицами).
СМИ
Здесь размещены события, относящиеся к случаям участия руководства или работников Росстата в средствах массовой информации. Это касается официальных публичных выступлений, интервью, а также комментариев. Имеется и Клуб деловой журналистики, где также выкладываются ссылки или статьи о пресс-конференциях, проводимых в рамках официальной деловой деятельности исполнительного органа.
В отдельном пункте собран весь пакет материалов СМИ, где не обошлось без подробностей брифингов или интервью сотрудников Росстата. В следующем пункте есть данные о личной пресс-службе органа, там указаны:
- Порядок подачи запросов от СМИ.
- Особенности коммуникационной политики Росстата.
- Реестр ответов средствам массовой информации на запросы.
- Отчетность о проделанной работе.
Отдел СМИ играет особую роль в этой структуре.
Примечания
- Малая советская энциклопедия. — М.: Советская энциклопедия, 1960. — Т. 8. — С. 1090.
- Райзберг Б. А., Лозовский Л. Ш., Стародубцева Е. Б. Современный экономический словарь. 5-е изд., перераб. и доп. — М.: ИНФРА-М, 2007. — 495 с. — (Библиотека словарей «ИНФРА-М»)
- Никитина Е. П., Фрейдлина В. Д., Ярхо А. В. Коллекция определений термина «статистика». — Москва: МГУ, 1972.
- Чупров А. А. Вопросы статистики. — М.: Госстатиздат ЦСУ СССР, 1960.
- Никитина Е. П., Фрейдлина В. Д., Ярхо А. Коллекция определений термина «статистика»
- Гнеденко Б. В. Очерк по истории теории вероятностей. — Москва: УРСС, 2001.
- Клейн Ф. Лекции о развитии математики в XIX столетии. Часть I. — Москва, Ленинград: Объединенное научно-техническое издательство НКТП СССР, 1937.
- Плошко Б. Г., Елисеева И. И. История статистики: Учеб. пособие. — Москва, Ленинград: Финансы и статистика, 1990.
- Huff, Darrell, How to Lie With Statistics, WW Norton & Company, Inc. New York, NY, 1954. ISBN 0-393-31072-8
- Warne, R. Lazo, M., Ramos, T. and Ritter, N. (2012). Statistical Methods Used in Gifted Education Journals, 2006—2010. Gifted Child Quarterly, 56(3) 134—149. doi: 10.1177/0016986212444122
- ↑ Encyclopedia of Archaeology (неопр.). — Credo Reference: Oxford: Elsevier Science, 2008.
- ↑ Cohen, Jerome B. Misuse of Statistics (англ.) // Journal of the American Statistical Association : journal. — JSTOR, 1938. — December (vol. 33, no. 204). — P. 657—674.
- Freund, J. F. Modern Elementary Statistics (неопр.) // Credo Reference. — 1988.
- ↑ .
- Mark Twain. . North American Review. Project Gutenberg (7 сентября 1906). Дата обращения 23 мая 2007.
Краткая история статистических методов
Типовые примеры раннего этапа применения статистических методов описаны в Библии, в Ветхом Завете. Там, в частности, приводится число воинов в различных племенах. С математической точки зрения дело сводилось к подсчёту числа попаданий значений наблюдаемых признаков в определённые градации.
Сразу после возникновения теории вероятностей (Паскаль, Ферма, XVII век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0,5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и так далее.
В 1794 году (по другим данным — в 1795) немецкий математик Карл Гаусс формализовал один из методов современной математической статистики — метод наименьших квадратов. В XIX веке значительный вклад в развитие практической статистики внёс бельгиец Кетле, на основе анализа большого числа реальных данных показавший устойчивость относительных статистических показателей, таких, как доля самоубийств среди всех смертей.
Первая треть XX века прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.
Разработанную в первой трети XX века теорию анализа данных называют параметрической статистикой, поскольку её основной объект изучения — это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым распределение результатов конкретных наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением и так далее.
Связь статистики с другими дисциплинами
Статистика является мультидисциплиной, так как она использует методы и принципы, заимствованные из других дисциплин. Так, в качестве теоретической базы для формирования статистической науки служат знания в области социологии и экономической теории. В рамках этих дисциплин происходит изучение законов общественных явлений. Статистика помогает произвести оценку масштаба того или иного явления, а также разработать систему методов для анализа и изучения. Статистика, несомненно, связана с математикой, так как для выявления закономерностей, оценки и анализа объекта исследования требуется ряд математических операций, методов и законов, а систематизация результатов находит отражения в виде графиков и таблиц.
Прикладная статистика
Прикладная статистика — это наука о том, как обрабатывать данные произвольной природы. Математической основой прикладной статистики и статистических методов анализа является теория вероятностей и математическая статистика.
Описание вида данных и механизма их порождения — начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.
В простейшей ситуации статистические данные — это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.
При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат — числа, а часть — качественные (категоризованные) данные, то говорим о векторе разнотипных данных.
Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, — электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.
Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы — образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечёткие множества и т. д.
Математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных — числовые и нечисловые. Соответственно прикладная статистика разбивается на две части — числовую статистику и нечисловую статистику.
Числовые статистические данные — это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки — это (классические) законы больших чисел и центральные предельные теоремы.
Нечисловые статистические данные — это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечёткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. ).
В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определённого момента времени, то получаем так называемые цензурированные данные, состоящие из набора чисел — продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.
Оптимальная численность выборки
РАЗДЕЛ 9
СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ
Методы изучения связи между явлениями
Основные понятия методов изучения связи между явлениями
Задачи статистики состоят в выявлении связи, определении ее направления и ее измерении. Наиболее же общая задача – это прогнозирование и регулирование социально-экономических явлений на основе полученных представлений о связях между явлениями.
Статистика рассматривает экономический закон как существенную и устойчивую связь между определенными явлениями и процессами. Познавая связи, статистика познает законы. А их знание позволяет управлять общественным развитием. Основой изучения связей является качественный анализ.
Различают два вида признаков:
— факторные – те, которые влияют на изменение других процессов;
— результативные – те, которые изменяются под воздействием других признаков.
В статистике связи классифицируются по степени их тесноты. Исходя из этого различают:
— функциональную (полную) связь;
— статистическую (неполную, корреляционную) связь.
Функциональная связь – такая связь, при которой значение результативного признака целиком определяется значением факторного (например, площадь круга). Она полностью сохраняет свою силу и проявляется во всех случаях наблюдения и для всех единиц наблюдения. Каждому значению факторного признака соответствует одно или несколько определенных значений результативного признака.
Для корреляционной связи характерно то, что одному и тому же значению факторного признака может соответствовать сколько угодно различных значений результативного признака. Здесь связь проявляется лишь при достаточно большом количестве наблюдений и лишь в форме средней величины.
По направлению изменений факторного и результативного признака различают связь прямую и обратную.
Прямая связь – такая связь, при которой с изменением значений факторного признака в одну сторону, в ту же сторону меняется и результативный признак.
Обратная связь – такая связь, при которой с увеличением (уменьшением) факторного признака происходит уменьшение (увеличение) результативного признака.
По аналитическому выражению выделяются две основные формы связи:
– прямолинейная (выражается уравнением прямой);
– криволинейная (описывается уравнениями кривых линий – гипербол, парабол, степенных функций).
Методы изучения связей:
— описательные (механические) методы:
— метод приведения параллельных рядов;
— балансовый метод;
— графический метод;
— метод аналитической группировки.
Наибольший эффект достигается при комбинировании нескольких методов:
— метод приведения параллельных рядов приводится ряд данных по одному признаку и параллельно с ним – по другому признаку, связь с которым предполагается; по вариации признака в первом и втором ряду судят о наличии связи признаков; такой метод позволяет вывести только направление связи, но не измерить ее;
— балансовый метод – взаимосвязь может быть также охарактеризована с помощью балансов;
— графический метод может использоваться как самостоятельно, так и совместно с другими методами; если конкретные данные перенести на график, то полученное изображение называется полем корреляции; на оси абсцисс откладывается значение факторного признака, а на оси ординат – результативного; каждая единица, обладающая определенным значением факторного и результативного признака, обозначается точкой; беспорядочное расположение говорит об отсутствии связи; наоборот, чем сильнее связь, тем теснее точки группируются вокруг определенной линии;
— метод аналитической группировки, при котором сначала выбираются два признака: факторный и результативный; по факторному признаку производится группировка, а по результативному – подсчет средних или относительных величин; путем сопоставления характера изменений значений факторного и результативного признака можно сделать вывод о наличии связи и ее направлении; при помощи метода аналитической группировки можно сделать вывод и о тесноте связи.
Крылатая фраза
Основная статья: Ложь, наглая ложь и статистика
Наиболее известная (и одна из лучших) критика прикладной статистики, «Существуют три вида обмана: ложь, наглая ложь и статистика», англ. There are three kinds of lies: lies, damned lies, and statistics) традиционно приписывается премьер-министру Великобритании Бенджамину Дизраэли, после атрибуции Марка Твена в публикации «Главы моей автобиографии» (журнал North American Review 5 июля 1907 года): «Цифры обманчивы, — писал он, — я убедился в этом на собственном опыте; по этому поводу справедливо высказался Дизраэли: „Существует три вида лжи: ложь, наглая ложь и статистика“». Однако этой фразы нет в работах Дизраэли, её происхождение спорно. В 1964 году К. Уайт (англ. Colin White) предположил авторство Франсуа Мажанди (1783—1855), который сказал фразу по-французски: фр. Ainsi l’altération de la vérité qui se manifeste déjà sous la forme progressive du mensonge et du parjure, nous offre-t-elle au superlatif, la statistique («Модификация правды, которая проявляется в сравнительной степени неправды и лжесвидетельства, имеет и суперлатив, статистику»). По словам Уайта, «мир нуждался в этой фразе, и несколько человек могли бы гордиться, придумав её».