ГЕОГРАФИЧЕСКИЙ ДИСКРИМИНАНТ И КЛАССИФИКАЦИЯ КОРИЦЫ КАССИИ, СОБРАННОЙ ВО ВЬЕТНАМЕ, С ИСПОЛЬЗОВАНИЕМ ИК-ФУРЬЕ-СПЕКТРОСКОПИИ АТR В СОЧЕТАНИИ С АЛГОРИТМАМИ МАШИННОГО ОБУЧЕНИЯ

  • Bui Thi Lan Phuong Phuong Ханойский фармацевтический университет
  • Hoang Thi Bich Ханойский фармацевтический университет
  • Nguyen Van Phuong Ханойский фармацевтический университет
  • Bui An Duy Ханойский фармацевтический университет
  • Nguyen Duc Phong Компания TRAPHACOт
  • Nguyen Manh Son Научный университет ВНУ
  • Pham Gia Bach Научный университет ВНУ
  • Nguyen Thi Cam Ha Научный университет ВНУ
  • Ta Thi Thao Научный университет ВНУ
  • Nguyen Thi Kieu Anh Ханойский фармацевтический университет
Ключевые слова: ATR-FTIR, Cinnamon cassia, производные спектров, географическая классификация, машинное обучение

Аннотация

Во Вьетнаме Cinnamomum cassia широко используется не только как пряность, но и как ключевой ингредиент в медицине, косметике и перерабатывающей промышленности. Различные климатические условия в различных географических регионах, где выращивается корица, значительно влияют на ее качество, что часто приводит к непреднамеренному смешиванию корицы из разных источников. Для анализа образцов корицы использовалась инфракрасная спектроскопия с нарушенным полным внутренним отражением и преобразованием Фурье (ATR-FTIR) для измерения 139 образцов, собранных в четырех различных провинциях Вьетнама – Йенбай, Куангнинь, Тханьхоа и Куангнам – каждая из которых представляла уникальные климатические условия. Для повышения качества данных был применен метод сглаживания второй производной Савицкого-Голея, что улучшило спектральное разрешение и снизило шум. Для оценки потенциала классификации использовались неконтролируемые хемометрические методы, включая анализ главных компонентов (PCA) и иерархический кластерный анализ (HCA). Кроме того, контролируемые модели машинного обучения, такие как Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), GausianNB, BernoulliNB, AdaBoost и Gradient Boosting, были объединены с результатами PCA и обучены с использованием сглаженных спектров первой производной Савицкого-Голея для классификации. Результаты показали, что модель PCA-SVM достигла наивысшей точности классификации (96.88%) со спектрами второй производной, тогда как первая производная и необработанные данные показали более низкую производительность. В этом исследовании подчеркивается, что спектроскопия ATR-FTIR в сочетании с предварительной обработкой второй производной и PCA-SVM обеспечивает простой, быстрый, неразрушающий и экономически эффективный подход для различения образцов коры корицы на основе их географического происхождения, предлагая ценную информацию для оценки качества.

Для цитирования:

Буи Тхи Лан Фуонг, Хоанг Тхи Бич, Нгуен Ван Фуонг, Буи Ан Дуй, Нгуен Дук Фонг, Нгуен Мань Сон, Фам Зиа Бах, Нгуен Тхи Кам Ха, Та Тхи Тхао, Нгуен Тхи Киеу Ань Географический дискриминант и классификация корицы кассии, собранной во Вьетнаме, с использованием ИК-Фурье-спектроскопии АТR в сочетании с алгоритмами машинного обучения. Изв. вузов. Химия и хим. технология. 2025. Т. 68. Вып. 7. С. 102-113. DOI: 10.6060/ivkkt.20256807.7246.

Литература

Hajimonfarednejad M., Ostovar M., Raee M.J., Hashempur M.H., Mayer J.G., Heydari M. Cinnamon: A systematic review of adverse events. J. Clin. Nutr. 2019. V. 38. N 2. P. 594-602. DOI: 10.1016/j.clnu.2018.03.013.

Derks A., Turner S., Thúy Hạnh N. Bastard Spice or Champagne of Cinnamon? Conflicting Value Creations along Cinnamon Commodity Chains in Northern Vietnam. Dev. Change. 2020. V. 51. N. 3. P. 895-920. DOI: 10.1111/dech.12582.

Luan D. X. Motivation and barriers to access to formal credit of primary cinnamon producers from the perspective of value chain development in Northwestern Vietnam. J. Agribusiness Dev. Emerg. Econom. 2020. V. 10. N 2. P. 117-138. DOI: 10.1108/JADEE-01-2019-0003.

Samaraweera D.N., Weerasuriya S.N., Karunaratne A.S., Subasinghe S., Senaratne R. Ecology, Agronomy and Management of Cinnamon (Cinnamomum zeylanicum Blume). In: Cinnamon: Botany, Agronomy, Chemistry and Industrial Applications. Ed. by R. Senaratne, R. Pathirana. Cham: Springer Internat. Publ. 2020. P. 171-200. DOI: 10.1007/978-3-030-54426-3_7.

Hashitha Nayananjalee Aluthgamage, Kumari Fonseka D.L.C., Niluka Nakandalage. Enhancement of high-quality cinnamon quill production through agronomic approaches: a review. Acad. Biol. 2023. V. 1. N 1. DOI: 10.20935/AcadBiol6025.

Nguyen A.T., Ta V.H., Nguyen V.H., Pham A.T., Monnerat M., Hens L. Shifting challenges for Cinnamomum cassia production in the mountains of Northern Vietnam: spatial analysis combined with semistructured interviews. Environ. Dev. Sustain. 2022. V. 24. N 5. P. 7213-7235. DOI: 10.1007/s10668-021-01745-x.

Saha S., Bhattacharya R., Chaudhary M., Hazarika T.K., Mitra A. Impact of geographical locations on essen-tial oil composition and leaf histochemistry in Cinnamomum verum J. S. Presl. J. Essent. Oil-Bear. Plants. 2023. V. 26. N 6. P. 1546 - 1562. DOI: 10.1080/0972060X.2023.2256779.

Woehrlin F., Fry H., Abraham K., Preiss-Weigert A. Quantification of flavoring constituents in cinnamon: high variation of coumarin in cassia bark from the German retail market and in authentic samples from indonesia. J Agric Food Chem. 2010. V. 58. N 19. P. 10568-75. DOI: 10.1021/jf102112p.

Pages-Rebull J., Pérez-Ràfols C., Serrano N., Díaz-Cruz J.M. Analytical methods for cinnamon authentication. Trends Food Sci. Technol. 2024. V. 146. 104388. DOI: 10.1016/j.tifs.2024.104388.

Castro R.C., Ribeiro D.S.M., Santos J.L.M., Páscoa R.N.M.J. Authentication/discrimination, identification and quantification of cinnamon adulterants using NIR spectroscopy and different chemometric tools: A tutorial to deal with counterfeit samples. Food Control. 2023. V. 147. 109619. DOI: 10.1016/j.foodcont.2023.109619.

Bansal S., Thakur S., Mangal M., Mangal A.K., Gupta R.K. DNA barcoding for specific and sensitive detection of Cuminum cyminum adulteration in Bunium persicum. Phytomedicine. 2018. V. 50. P. 178-83. DOI: 10.1016/j.phymed.2018.04.023.

Feltes G., Ballen S.C., Steffens J., Paroul N., Steffens C. Differentiating True and False Cinnamon: Exploring Mul-tiple Approaches for Discrimination. Micromachines. 2023. V. 14. N 10. 1819. DOI: 10.3390/mi14101819.

Pham Quang Trung, Hoang Bich Ngoc, Nguyen Van Thuc, Tran Thi Hue, Pham Gia Bach, Ta Thi Thao. Chemical characterization and classification of geographical origin of Vietnamese green teas based on 1H-NMR data combined with machine learning. ChemChemTech [Izv. Vyssh. Uchebn. Zaved. Khim. Khim. Tekhnol.]. 2023. V. 66. N 12. P. 56-64. DOI: 10.6060/ivkkt.20236612.6874.

Ding Y., Wu E.Q., Liang C., Chen J., Tran M.N., Hong C.H., Jang Y., Park K.L., Bae K., Kim Y.H., Kang J.S. Discrimination of cinnamon bark and cinnamon twig sam-ples sourced from various countries using HPLC-based fingerprint analysis. Food Chem. 2011. V. 127. N 2. P. 755-760. DOI: 10.1016/j.foodchem.2011.01.011.

Liu C., Long H., Wu X., Hou J., Gao L., Yao S., Lei M., Zhang Z., Guo D.-a., Wu W. Quantitative and fingerprint analysis of proanthocyanidins and phenylpropanoids in Cinnamomum verum bark, Cinnamomum cassia bark, and Cassia twig by UPLC combined with chemometrics. Eur. Food Res. Technol. 2021. V. 247. N 11. P. 2687-2698. DOI: 10.1007/s00217-021-03795-x.

Pages-Rebull J., Sagristà G., Pérez-Ràfols C., Serrano N., Díaz-Cruz J.M. Application of HPLC-UV combined with chemometrics for the detection and quantification of 'true cinnamon' adulteration. Talanta. 2024. V. 271. 125676. DOI: 10.1016/j.talanta.2024.125676.

Farag M.A., Kabbash E.M., Mediani A., Döll S., Esatbeyoglu T., Afifi S.M. Comparative Metabolite Finger-printing of Four Different Cinnamon Species Analyzed via UPLC–MS and GC–MS and Chemometric Tools. Mole-cules. 2022. V. 27. N 9. 2935. DOI: 10.3390/molecules27092935.

Suzuki R., Kasuya Y., Sano A., Tomita J., Maruyama T., Kitamura M. Comparison of various commercially available cinnamon barks using NMR metabolomics and the quantification of coumarin by quantitative NMR methods. J. Nat. Med. 2022. V. 76. N 1. P. 87-93. DOI: 10.1007/s11418-021-01554-6.

Pan Y., Qiao L., Liu S., He Y., Huang D., Wu W., Liu Y., Chen L., Huang D. Explorative Study on Volatile Organic Compounds of Cinnamon Based on GC-IMS. Me-tabolites. 2024. V. 14. N 5. P. 274. DOI: 10.3390/metabo14050274.

Ballin N.Z., Laursen K.H. To target or not to target? Definitions and nomenclature for targeted versus non-targeted analytical food authentication. Trends Food Sci. Technol. 2019. V. 86. P. 537-543. DOI: 10.1016/j.tifs.2018.09.025.

Pei Y.-F., Zhang Q.-Z., Zuo Z.-T., Wang Y.-Z. Comparison and Identification for Rhizomes and Leaves of Paris yunnanensis Based on Fourier Transform Mid-Infrared Spectroscopy Combined with Chemometrics. Molecules. 2018. V. 23. N 12. 3343. DOI: 10.3390/molecules23123343.

Ying Zhu, Augustine Tuck Lee Tan. Chemometric Feature Selection and Classification of Ganoderma lucidum Spores and Fruiting Body Using ATR-FTIR Spectroscopy. Am. J. Anal. Chem. 2015. V. 6. N P. 830-840. DOI: 10.4236/ajac.2015.610079.

Lixourgioti P., Goggin K.A., Zhao X., Murphy D.J., van Ruth S., Koidis A. Authentication of cinnamon spice samples using FT-IR spectroscopy and chemometric clas-sification. LWT. 2022. V. 154. 112760. DOI: 10.1016/j.lwt.2021.112760.

Silaev D.V., Shestopalova N.B., Fomina Yu.A., Rusanova T.Yu. Application of chemometric algorithms for spec-trophotometric determination of synthetic food colors. ChemChemTech [Izv. Vyssh. Uchebn. Zaved. Khim. Khim. Tekhnol.]. 2022. V. 65. N 2. P. 50-59. DOI: 10.6060/ivkkt.20226502.6497.

Chu Thi Thu Ha. State of the environment and natural resources in Vietnam. J. Viet. Env. 2014. V. 6. N 1. P. 1-3. DOI: 10.13141/jve.vol6.no1.pp1-3.

Luo J., Ying K., Bai J. Savitzky–Golay smoothing and differentiation filter for even number data. Signal Process. 2005. V. 85. N 7. P. 1429-1434. DOI: 10.1016/j.sigpro.2005.02.002.

Smoliński A., Walczak B., Einax J.W. Hierarchical clustering extended with visual complements of environmental data set. Chemometr. Intell. Lab. Syst. 2002. V. 64. N 1. P. 45-54. DOI: 10.1016/S0169-7439(02)00049-7.

Wold S., Esbensen K., Geladi P. Principal component analysis. Chemometr. Intell. Lab. Syst. 1987. V. 2. N 1. P. 37-52. DOI: 10.1016/0169-7439(87)80084-9.

Luts J., Ojeda F., Van de Plas R., De Moor B., Van Huffel S., Suykens J.A.K. A tutorial on support vector machine-based methods for classification problems in chemometrics. Anal. Chim. Acta. 2010. V. 665. N 2. P. 129-45. DOI: 10.1016/j.aca.2010.03.030.

Shobha G., Rangaswamy S. Chapter 8 - Machine Learning. Handbook of Statistics. 2018. V. 38. P. 197-228. DOI: 10.1016/bs.host.2018.07.004.

Scott I.M., Lin W., Liakata M., Wood J.E., Vermeer C.P., Allaway D., Ward J.L., Draper J., Beale M.H., Corol D.I., Baker J.M., King R.D. Merits of random forests emerge in evaluation of chemometric classifiers by external validation. Anal. Chim. Acta. 2013. V. 801. P. 22-33. DOI: 10.1016/j.aca.2013.09.027.

Liu S., McGree J., Ge Z., Xie Y. 2 - Classification methods. In: Computational and Statistical Methods for Analysing Big Data with Applications. Ed. by S. Liu, J. McGree, Z. Ge, Y. Xie. San Diego: Academic Press. 2016. P. 7-28. DOI: 10.1016/B978-0-12-803732-4.00002-7.

de Giorgio A., Cola G., Wang L. Systematic review of class imbalance problems in manufacturing. J. Manuf. Syst. 2023. V. 71. P. 620-44. DOI: 10.1016/j.jmsy.2023.10.014.

Belyadi H., Haghighat A. Chapter 5 - Supervised learn-ing. In: Machine Learning Guide for Oil and Gas Using Python. Ed. by H. Belyadi, A. Haghighat. Gulf Professional Publ. 2021. P. 169-295. DOI: 10.1016/B978-0-12-821929-4.00004-4.

Опубликован
2025-05-15
Как цитировать
Phuong, B. T. L. P., Bich, H. T., Phuong, N. V., Duy, B. A., Phong, N. D., Son, N. M., Bach, P. G., Ha, N. T. C., Thao, T. T., & Anh, N. T. K. (2025). ГЕОГРАФИЧЕСКИЙ ДИСКРИМИНАНТ И КЛАССИФИКАЦИЯ КОРИЦЫ КАССИИ, СОБРАННОЙ ВО ВЬЕТНАМЕ, С ИСПОЛЬЗОВАНИЕМ ИК-ФУРЬЕ-СПЕКТРОСКОПИИ АТR В СОЧЕТАНИИ С АЛГОРИТМАМИ МАШИННОГО ОБУЧЕНИЯ. ИЗВЕСТИЯ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ. СЕРИЯ «ХИМИЯ И ХИМИЧЕСКАЯ ТЕХНОЛОГИЯ», 68(7), 102-113. https://doi.org/10.6060/ivkkt.20256807.7246
Раздел
ХИМИЯ неорганич., органич., аналитич., физич., коллоидная, высокомол. соединений