logo
map
letter
home

Тел.: (495) 988-40-91

Моб. тел.: (916) 721-54-99

В 2025 году журналу
ИСПОЛНИТСЯ
95 ЛЕТ!

РУБРИКИ

Творчество
наших читателей

ЧИТАЙТЕ
Автор С.И. КАЛИНИЧЕНКО
ГИМН СВИНЬЕ >>>

СТАТЬИ ИЗ НОМЕРА

DOI: 10.37925/0039-713X-2025-6-4-7
УДК 636.4
ВАЛИДАЦИЯ РЕЗУЛЬТАТОВ ПРОГНОЗА ПЛЕМЕННОЙ ЦЕННОСТИ

М.В. БЕЛОВА1, начальник селекционно-генетического управления, А.И. РУДЬ1, доктор с.-х. наук, руководитель научно-исследовательского отдела селекции животных, А.А. ХАЙДАРОВ1, гл. зоотехник-селекционер, А.Д. САМОЙЛОВ2, директор по цифровой трансформации, М.В. СТРУЧАЛИН3,4, кандидат биолог. наук, директор, И.В. РУКИН5, кандидат биолог. наук, директор по научным исследованиям и разработкам, И.Р. МИФТАХОВ6, кандидат тех. наук, мл. научный сотрудник молодежной научной лаборатории селективной гибридизации животных, О.А. ГУСЕВ3,7, кандидат биолог. наук, вед. научный сотрудник, зав. лабораторией «Геномные и постгеномные технологии в животноводстве», руководитель группы «Молекулярная биомиметика», 1ООО «Башкирская мясная компания» (ГК «Таврос»), 2АО «Смарт Технологии Инвест», 3ФГБНУ «Уфимский федеральный исследовательский центр РАН», 4ООО «Компьютбио», 5АО «Агроплем», 6ФГБОУ ВО «Башкирский ГАУ», 7ООО «ЛИФТ Центр» (Москва)

В статье описаны критерии подтверждения надежности сведений первичного зоотехнического учета в селекционной работе в свиноводстве. Дана характеристика точности и надежности (Reliability) прогноза племенной ценности. Приведены данные ООО «Башкирская мясная компания» об изменении надежности прогноза по основным селекционным признакам в разрезе пород йоркшир, ландрас и дюрок при дополнении BLUP-оценки результатами генотипирования. Перечислены различные варианты кросс-валидации показателей и их особенности при оценке эффективности селекционной модели.

Ключевые слова: свиноводство, валидация данных, кросс-валидация данных, надежность прогноза, метод BLUP, генотипирование, оценка эффективности селекционной модели.

Validation of the results of breeding value forecasting

M.V. BELOVA1, head of the selection and genetics department, A.I. RUD1, doctor of agricultural sciences, head of the animal breeding research department, A.A. KHAYDAROV1, chief livestock breeder, A.D. SAMOYLOV2, director of digital transformation, M.V. STRUCHALIN3,4, candidate of biologic sciences, director, I.V. RUKIN5, candidate of biological sciences, director of research and development, I.R. MIFTAHOV6, candidate of technical sciences, junior researcher of the youth scientific laboratory of selective animalhybridization O.A. GUSEV3,7, candidate of biological sciences, leading researcher, head of the laboratory Genomic and Post-Genomic Technologies in Animal Husbandry, head of the Molecular Biomimetics Group, 1Bashkir Meat Company LLC, 2Smart Technology Invest PLC, 3Ufa Federal Research Centre of the Russian Academy of Sciences, 4Computebio LLC, 5Agroplem PLC, 6Bashkir State Agrarian University, 7LIFT Center LLC (Moscow)

The criteria for confirming the reliability of primary zootechnical accounting data in breeding work in pig production are described. The characteristics of the accuracy and reliability of the estimated breeding value calculation are provided. Data from Bashkir Meat Company LLC regarding the changes in the reliability of predictions for key breeding traits across the Yorkshire, Landrace, and Duroc breeds when supplementing BLUP estimates with genotyping results are presented. Various options for cross-validation of data and their specific features in assessing the effectiveness of the breeding model are listed.

Key words: pig-breeding, data validation, data cross-validation, reliability, BLUP, genotyping, efficiency of the selection model.

 

Для динамичного улучшения производственных показателей от поколения к поколению необходимо отбирать для чистопородного разведения животных, имеющих наивысшую племенную ценность. Современные методы прогноза племенной ценности базируются на сложных математических моделях, таких как наилучший линейный несмещенный прогноз (BLUP, GBLUP, ssGBLUP), байесовская регрессия и другие модели машинного обучения. Цена ошибки огромна: недостоверные результаты оценки генетического потенциала будут сопровождаться не улучшением, а ухудшением производственных показателей.

Практика показывает, что современный высокий уровень продуктивности свиней оборачивается снижением их адаптивных качеств. Даже поддержание селекционных признаков на достигнутом уровне возможно только при постоянном жестком селекционном отборе. Падение качества отбора приводит к ухудшению производственных показателей с дальнейшим откатом к уровню, обеспечивающему лучшее выживание животного, а не его максимальную продуктивность [1].

Для оценки эффективности прогнозов племенной ценности в мировой практике разработаны методы валидации (проверки) показателей на разных этапах их применения в селекционной работе. Процесс валидации подтверждает, что полученные результаты соответствуют целевым критериям и могут быть использованы в селекционно-генетической программе. В ходе проверки анализируются корректность формата данных, правдоподобность и логическая совместимость с остальной информацией [2].

Валидация результатов прогноза племенной ценности включает три этапа.

1. Оценка повторяемости первичных данных зоотехнического учета (Accuracy)

В компании Pig Improvement Company (Великобритания) для описания данного процесса используют термин «accuracy», который переводится как «точность». Точность измеряется как корреляция между повторными измерениями, например живой массы, толщины шпика, глубины длиннейшей мышцы спины.

2. Анализ надежности прогноза племенной ценности в рамках выбранной селекционной модели (Reliability)

Племенную ценность животных по отдельным селекционным признакам характеризует EBV (estimated breeding value ‒ прогнозируемая племенная ценность). EBV измеряют в единицах признака [3]. Прогнозируемая племенная ценность показывает разность между прогнозируемой величиной признака в потомстве животного и средним значением признака в популяции (стаде). Для оценки надежности расчета EBV используют термин «reliability» .

В зарубежной селекции разделяют точность и надежность прогноза EBV. Точность прогноза показывает корреляцию (r) между EBV и истинным значениями племенной ценности (BV – breeding value); надежность прогноза (Reliability) описывает квадрат корреляции (r2 или REL) между EBV и BV. Для расчета EBV используют специализированные программы ‒ как правило, BLUPF90 [4] или MiXBLUP [5]. Истинное значение BV неизвестно, поэтому надежность прогноза оценивают с помощью диагональных элементов обратной матрицы коэффициентов уравнения смешанной модели по формуле:

,

где C22 – соответствующий диагональный элемент обратной матрицы MME,  – аддитивная генетическая варианса,  – остаточная варианса.

Величина Reliability зависит от коэффициента наследуемости признака, количества родственников в прогнозе, наличия или отсутствия информации о геноме животного в модели прогноза.

Ниже приведены варианты кодировки результатов прогноза племенной ценности животных в зависимости от информации, которую использовали в прогнозе:

1) PA (parent average) – в модели присутствовала только информация о происхождении животных;

2) EBV (estimated breeding value) в модели присутствовала информация о происхождении животных, а также собственные фенотипические данные и фенотипические данные потомков хотя бы по одному признаку;

3) GEBV (genomic estimated breeding value) в модели присутствовала информация о происхождении животных, собственные фенотипические данные и фенотипические данные потомков хотя бы по одному признаку, а также информация о геноме животного;

4) GPA (genomic parent average) в модели присутствовала информация о происхождении животных, а также информация о геноме животного.

К величине Reliability предъявляют определенные требования: например, в молочном скотоводстве используют животных со значением EBV по целевым селекционным признакам не ниже 65% [6]. Такие высокие значения возможно получить, так как производитель имеет многочисленное потомство и большое количество родственников различных степеней родства в сочетании с массовым генотипированием быков-производителей.

Также значимое влияние на эффективность модели имеет качество и количество используемых факторов при ее формировании. При включении каждого фактора в модель учитывают ряд требований:

▪ фактор должен иметь высокую корреляцию с результирующим признаком;

▪ если пара факторов имеет корреляцию между собой выше 0,7, в модель включают тот фактор, корреляция которого с результирующим признаком максимальна;

▪ количество факторов в модели не должно быть чрезмерным, чтобы избежать раздробления данных на слишком мелкие группы и снижения точности прогноза; при выборе факторов следует ограничиваться только биологически и статистически значимыми признаками [7];

▪ количество факторов должно обеспечивать поголовье животных в группе сравнения при расчете EBV более 20 голов; если выбранная модель детерминирует разделение массива животных на большое количество групп, например по одной-пять голов в группе, такая модель некорректна [8].

В ООО «Башкирская мясная компания» оценили влияние на селекционные признаки, характеризующие воспроизводительную способность свиней, следующих факторов:

‒ возраст опороса;

‒ возраст первого опороса;

‒ год ‒ месяц рождения;

‒ ферма ‒ год ‒ сезон опороса;

‒ количество сибсов;

‒ многоплодие на предыдущем цикле;

‒ номер цикла;

‒ номер цикла матери, в котором родилось животное;

‒ ферма – год рождения;

‒ пол;

‒ ферма.

Нами построены модели, специализированные для пород йоркшир, ландрас и дюрок. В зарубежных литературных источниках отдельные авторы рекомендуют использовать единую модель для всех пород свиней, включая в модель в качестве отдельного фактора породу. В наших расчетах оптимальная комбинация факторов для каждой породы свиней различна.

ООО «Башкирская мясная компания» совместно с АО «Агроплем» оценила степень повышения надежности EBV (Reliability) основных селекционных признаков при дополнении результатов BLUP-оценки данными генотипирования. Среднее повышение надежности прогноза племенной ценности селекционных признаков по йоркширам составило 22,1%, по ландрасам – 12,2%, по дюркам – 4,5% (табл. 1).

Полученные расхождения надежности прогноза между породами, на наш взгляд, обусловлены различным поголовьем животных, соответственно, несопоставимым с объемом фенотипических данных, которые были использованы в оценке. Например, база фенотипов по йоркширам составляла 123,238 тыс. голов, по ландрасам ‒ 37,672 тыс. голов, а по дюркам ‒ 29,445 тыс. голов (табл. 2). От общего количества прогенотипированных свиней на долю йоркширов приходится 70,0%, ландрасов – 21,2%, дюрков – 8,8%. В дальнейшем запланировано сместить акцент генотипирования с йоркширов, по которым уже сформирована референсная популяция ‒ приблизительно 7000 голов, на ландрасов и дюрков.


Таблица 1. Повышение надежности прогноза племенной ценности при дополнении BLUP-оценки результатами генотипирования

№ п/п

Признак

YY (йоркшир)

LL (ландрас)

DD (дюрок)

средняя надежность прогноза, %

дельта

средняя надежность прогноза, %

дельта

средняя надежность прогноза, %

дельта

BLUP

ssGBLUP

BLUP

ssGBLUP

BLUP

ssGBLUP

1

Крупно­плодность, г

28

49

21

24

32

8

23

26

3

2

Средне­суточный прирост живой массы, г

36

59

23

24

37

13

28

34

6

3

Многоплодие, гол.

42

64

22

36

48

12

23

24

1

4

Общее кол-во родившихся поросят, гол.

42

63

21

37

49

12

19

21

2

5

Глубина «мышечного глазка», мм

37

61

24

30

41

11

27

33

6

6

Обхват пясти, см

33

56

23

24

40

16

23

28

5

7

Кол-во функциональных сосков, шт.

32

54

22

28

38

10

28

34

6

8

Продолжи­тельность супоросности, дн.

56

77

21

49

62

13

35

39

4

9

Толщина шпика над 10‒11-м ребром, мм

40

65

25

26

43

17

34

43

9

10

Толщина шпика над 6‒7-м ребром, мм

39

63

24

25

41

16

33

40

7

11

Длина туловища, см

30

52

22

17

28

11

30

34

4

12

Масса гнезда при рождении, кг

22

39

17

19

26

7

18

19

1

 

В среднем

   

22,1

   

12,2

   

4,5


Таблица 2. Количество животных в раунде прогноза племенной ценности

Порода

Общее кол-во, гол.

В том числе

свиноматки

хряки

Йоркшир

123 238

109 758

13 480

Ландрас

37 672

29 113

8559

Дюрок

29 445

15 293

14 152

Внедрение геномной селекции на основе родственных связей (RBGS) в генетическую программу PIC в 2013 году увеличило традиционные темпы генетического прогресса (точность индекса) более чем на 35% в год для всех признаков [9].

Полученные результаты доказывают целесообразность объединения нескольких племенных хозяйств со сходной генетикой в единый консорциум с формированием единой базы данных. Увеличение массива данных позволит повысить точность прогноза племенной ценности животных у каждого участника консорциума. Как следствие, эффективность отбора в каждом хозяйстве будет выше. Дополнительным бонусом станет формирование единого списка чемпионов по отдельным селекционным признакам и точечный обмен генетикой между племенными хозяйствами.

У животных с выдающимися генотипами (максимальными EBV по отдельным селекционным признакам) показатели Reliability могут быть ниже и не достигать пороговых значений надежности прогноза. Применение таких животных в селекции обоснованно, поэтому селекционеру при принятии решений о дальнейшем использовании животных нужно учитывать величину каждого из этих параметров.

Надежность прогноза позволяет оценить качество расчетов в рамках выбранной селекционной модели. Если изначально модель не дает ожидаемого результата, то эффект селекции может быть близок к нулю независимо от величины надежности прогноза. Оценить успешность модели возможно с помощью методики кросс-валидации (cross-validation, CV), или перекрестной проверки.

Общий принцип кросс-валидации заключается в маскировании части данных и расчете EBV с использованием (EBV2 ) и без использования (EBV1 ) замаскированных данных. Далее по аналогии с Reliability рассчитывается квадрат корреляции (r2) между EBV1 и EBV2 . К пороговым значениям квадрата корреляции при оценке эффективности модели требования не предъявляют. При сравнении различных вариантов модели выбирают ту из них, которая обеспечивает максимальное значение квадрата корреляции при сопоставлении с остальными.

В мировой практике анализа данных разработаны различные варианты методики кросс-валидации.

1. Leave-one-out CV (cross-validation) – проверка прогностического потенциала модели по одному животному: сравнение прогноза до и после маскировки данных, характеризующих это животное.

2. K-Fold CV (cross-validation) – последовательное маскирование фиксированной доли данных (обычно 20%) в общей базе данных; процесс повторяется K раз (рис.) [10].

3. Stratified K-Fold CV (stratified cross-validation) – стратифицированное разделение базы данных: при каждой 20%-ной маскировке выборка формируется так, чтобы в ней были представлены все породы, фермы и поколения.

4. Nested CV (nested cross-validation) – вложенная кросс-валидация: на первом этапе выполняется настройка модели (например, подбор комбинации факторов модели, количества поколений родословной и др.), на втором этапе – проверка качества прогноза.

5. Monte Carlo CV (Monte Carlo cross-validation) – многократное случайное формирование обучающих и тестовых выборок (например, 100-кратное случайное исключение 20% животных в различных комбинациях) с последующей оценкой стабильности результатов при серии рандомных отборов.

6. Time-Based CV (time-based cross-validation) – временная кросс-валидация: проверка прогноза на потомках. Это наиболее практичная модель для селекционных программ, позволяющая оценить генотип животных до появления данных о собственном фенотипе, а затем сверить прогноз с фактическими фенотипическими результатами.

Рис. Пример K-Fold-валидации

Выводы

1. Для повышения эффекта селекции необходимо проводить валидацию данных на различных этапах прогноза племенной ценности животных:

▪ повторные измерения фенотипа (Accuracy) для живой массы, толщины шпика и глубины мышцы;

▪ определение Reliability для оценки надежности расчета EBV в рамках выбранной селекционной модели;

▪ кросс-валидацию селекционных моделей для использования в селекции той модели, которая обеспечивает максимальную надежность прогноза племенной ценности.

2. Повышение надежности прогноза племенной ценности обеспечивает включение в прогноз результатов генотипирования. Эффект от него тем больше, чем больше общий массив фенотипических и геномных данных. В ООО «Башкирская мясная компания», для йоркширов среднее повышение надежности оценки при использовании результатов генотипирования на текущий момент составило 22,1%, для ландрасов ‒ 12,2%, для дюрков – 4,5%.

3. Один из вариантов повышения надежности прогноза племенной ценности – объединение нескольких племенных хозяйств со сходной генетикой в единый консорциум с формированием единой базы данных фенотипов и генотипов.

 

Исследование выполнено в рамках реализации программы «Мегагранты» Минобрнауки России по теме «Разработка эффективных инструментов для развития животноводства с использованием генетических технологий и анализа больших данных», соглашение №075-15-2024-666 от 27.08.2024 года

 

Литература

  1. Ручкина Г.А. Влияние интенсивного использования высокопродуктивных свиноматок на их физиологическое состояние и продуктивность: Автореферат диссертации кандидата биолог. наук. Уфа, 2003. 16 с.
  2. Что такое валидация данных: основные принципы и методы проверки. ru.ruwiki.ru. https://sky.pro/wiki/python/ponimaem-funktsiyu-enumerate-v-python-na-primere-koda.
  3. Рудь А.И. Селекция свиней на улучшение мясных качеств с использованием метода BLUP/А.И. Рудь, П.В. Ларионова, Е.Г. Пархоменко, И.Ю. Атамась, А.А. Заболотная, Н.П. Юдина. п. Дубровицы, 2013. 62 с.
  4. Misztal I. BLUPF90 family of programs/Misztal I., Tsuruta M., Lourenco D., Masuda Y. et al. University of Georgia, Athens, USA. 2024. 161 p.
  5. Napel J., Vandenplas J., Lidauer M. et al. Manual MiXBLUP 3.0.1. Animal Breeding & Genomics, Wageningen University & Research version 3.0. 2021. P. 141.
  6. Pryce J.E., Brotherstone S. Estimation of lifespan breeding values in the UK and their relationship with health and fertility traits. Interbull Bulletin, 1999. №21. URL: PDF: https://journal.interbull.org/index.php/ib/article/download/622/622/1539.
  7. Mrode R.A. Linear models for the prediction of animal breeding values (3rd edition). CABI Publishing, 2014.
  8. Рудь А.И., Ларионова П.В., Зиновьева Н.А. с соавт. Продолжительность формирования групп сверстниц как фактор точности оценки генотипа по методу BLUP. Свиноводство, 2009. №8. С. 8‒12.
  9. Программа генетического улучшения PIC. Презентация. 2024.
  10. Стручалин М.В. Введение в предсказание племенной ценности животного. Презентация. 2025. 238 слайдов.

 

Скачайте в формате .pdf >>>

вверх