Новый подход к поиску строковой медианы и визуализация строковых кластеров
https://doi.org/10.22405/2226-8383-2019-20-2-93-107
Список литературы
1. Гасфилд Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология. СПб.: Невский Диалект, БХВ-Петербург, 2003.
2. Офицеров Е.П. Статистическая модель периферической селекции Т-клеточных рецепторов // Известия ТулГУ. Технические науки. 2017. Вып. 2. С. 138–143.
3. Офицеров Е.П. Глубокая модель селекции Т-клеточных рецепторов // Известия ТулГУ. Технические науки. 2017. Вып. 12. Ч. 2. С. 350–355.
4. Офицеров Е.П. Классификация последовательностей на основе коротких мотивов. Чебышевский сборник. 2018. Том 19, №:1. С. 187–199. doi: 10.22405/2226-8383-2018-19-1-187-199
5. Офицеров Е.П. Программный комплекс для решения задач машинного обучения на строковых данных при помощи дифференцируемого редакционного расстояния // Известия ТулГУ. Технические науки. 2019. Вып. 5. С. 370–376.
6. Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978.
7. Boyd S., Vandenberghe L. Convex Optimization. Cambridge University Press, 2004.
8. Casacuberta F., de Antonio M. A greedy algorithm for computing approximate median strings // In: VII Simposium Nacional de Reconocimiento de Formas y An’alisis de Im’agenes. 1997. P. 193–198.
9. De la Higuera C., Casacuberta F. Topology of strings: Median string is NP-complete // Theoretical Computer Science. 2000. Vol. 230, no. 1–2. P. 39–48. doi: 10.1016/s0304-3975(97)00240-5
10. Hayashida M., Koyano H. Finding median and center strings for a probability distribution on a set of strings under Levenshtein distance based on integer linear programming // In: Fred A., Gamboa H. (eds) Biomedical Engineering Systems and Technologies. BIOSTEC 2016. Communications in Computer and Information Science. Springer, Cham. 2017. Vol 690. P. 108–121.
11. Kruzslicz F. Improved greedy algorithm for computing approximate median strings // Acta Cybernetica. 1999. Vol. 14, no. 2. P. 331–339.
12. MartÍnez-Hinarejos C.D., Juan A., Casacuberta F. Use of median string for classification // Proc. 15th Int. Conf. on Pattern Recognition. ICPR-2000, Barcelona, Spain. 2000. Vol. 2. P. 903–906. doi: 10.1109/ICPR.2000.906220
13. Van der Maaten L., Hinton G. Visualizing data using t-SNE // J. Mach. Learn. Res. 2008. Vol. 9. P. 2579–2605.
14. Ofitserov E., Tsvetkov V., Nazarov V. Soft edit distance for differentiable comparison of symbolic sequences // arXiv:1904.12562. 2019.
15. Olivares-Rodr’ıguez C., Oncina J. A stochastic approach to median string computation // In: da Vitoria Lobo N. et al. (eds) Structural, Syntactic, and Statistical Pattern Recognition. SSPR /SPR 2008. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg. 2008. Vol. 5342. P. 431–440.
16. Ruder S. An overview of gradient descent optimization algorithms // arXiv:1609.04747. 2016.
17. Sammon J.W. A nonlinear mapping for data structure analysis // IEEE Transactions on Computers, 18(5):401–409, 1969.
18. Torgerson W.S. Multidimensional scaling I: Theory and method // Psychometrika. 1952. Vol. 17. P. 401–419.
19. Wang L., Jiang T. On the complexity of multiple sequence alignment // J. Computat. Biol. 1994. Vol. 1, no. 4. P. 337–348.
Рецензия
Для цитирования:
Горбачев Д.В., Офицеров Е.П. Новый подход к поиску строковой медианы и визуализация строковых кластеров. Чебышевский сборник. 2019;20(2):93-107. https://doi.org/10.22405/2226-8383-2019-20-2-93-107
For citation:
Gorbachev D.V., Ofitserov E.P. New approach to searching for string median and visualization of string clusters. Chebyshevskii Sbornik. 2019;20(2):93-107. (In Russ.) https://doi.org/10.22405/2226-8383-2019-20-2-93-107