АКАДЕМИЯ НАУК СССР
НАУЧНЫЙ СОВЕТ ПО КОМПЛЕКСНОЙ ПРОБЛЕМЕ "КИБЕРНЕТИКА"
Е. И. 1ИЛИНСКАЯ, Н. Н. ТОВМАЧЕНКО, В. В. ФЩОРОВ
МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА ПРИ НАЛИЧИИ
ОШИБОК В ПРЕДИКТОРНЫХ ПЕРЕМЕННЫХ
(Предварительная публикация)
Москва-1979
В работе исследуются приближенные методы анализа
регрессионных задач при наличии ошибок в предикторных
переменных» В вычислительном плане эти методы тесно
связаны с методом наименьших квадратов» что существенно
облегчает соэдание соответствующего математического
обеспечения. Асимптотически предлагаемые оценки при
выполнении ряда естественных требований обладают тем же
набором овойотв, что и оценки метода наименьших
квадратов в случае классической регрессии при нелинейной
параметризации»
ВВВДЕНИЕ
Предположим, что величина иГ (отклик) и переменные
•* (которые в дальнейшем будут называться предикторными)
связаны соотношением
W"l(x>e«), (i)
П<*£(&,0) - заданная функция аргументов эсел* и £б52с*7
Индекс "ии здесь и далее отмечает истинные значения
соответствующих величин. Обобщения излагаемых ниже результатов на
случай многомерного отклика № особых трудностей не
представляет и специально рассматриваться не будет»
Целью регрессионных экспериментов, изучаемых в
настоящей работе является оценивание параметров в по наблюдениям
над парами ( 4^ % Xi ), I ■ TJL . В реальных ситуациях,
по крайней мере, одна из величин &" или Л известны
исследователю с некоторой "существенной" ошибкой. Ниже будут
рассматриваться следующие регрессионные модели:
Классическая регрессия, Цусть исследователю известны
величины Ui *ш*1 + £± , или в более привычной форме:
где Bi - случайные погрешности наблюдений (детали и более
общие постановки см. , например! [l] глава 4).
Величины 321,
которые часто называют условиями I -го наблюдения, известны
точно: либо точно фиксируются, либо точно наблюдаются. Активные регрессионные эксперименты. Предположим, что
исследователь стремится провести наблюдения при условиях ^ l »
1-2
-3-
но в силу тех шш иных причин (случайных по овоецу характеру)
изучаемый объект оказывается в условиях obi * ^ * Ас^
причем значения Л^' * неизвестны. Таким образом,
доступными для анализа являются величины
Объединяя (I) и (3), соответствующую регрессионную
модель можно представить в виде '
ffi * >1С"1*А>1>еи. )+Ес> (4)
где и£ и и>с - известны экспериментатору, а &-^ и 8 i
- случайные величины (погрешности фиксации и наблюдений
соответственно) •
Паооивные наблюдения. При пассивных наблюдениях условия
ос с задаются "природой", а исследователь имеет возможность
их наблюдать (со случайной погрешностью &i ) одновременно
о iii • т#е* известны величины
ft = ип +£i, uL?xL + Ai. (5)
Объединяя (I) и (5), получим регрессионную модель
i:WW'*
Впервые достаточно четкое разделение схем активного и
пассивного экспериментов было проведено, по-видимому, в
работе f2j , см. также [3] , глава 29. Хотя приведенные выше три регрессионные задачи, как будет
ясно из дальнейшего, содержат много общего не только в
постановке, но ж в методах анализа, они имеют к некоторые
принципиальные отличия (выяонение этих фактов ж есть одна из целей
настоящего обзора).