Runoske> в MPEG используется анализ соседних кадров для сжатия, но причём здесь
MPEG, как раз, не требует больших мощностей. Жать можно на старом и слабом железе.
Больших мощностей требуют алгоритмы, типа h264, но там, как раз, используется распознавание движущихся объектов для раздельной компрессии не только межкадровых изменений, но и конкретных видов этих изменений. Например, скроллинг, при котором бэкграунд уезжает в сторону, в mpeg будет паковаться плохо, т.к. учитываются только изменения пикселов и картинки при скроллинге будут отличаться почти всем, а в h264 сжатие будет отличным, потому что будет вычислено направление и скорость скроллинга и соответствующее смещение будет учитываться при расчёте межкадровой разности.
Но критерии всё равно будут сильно отличаться от тех, что используются в распознавании в библиотеках, типа OpenCV. В первую очередь — требование к скорости. Если OpenCV распознаёт пару картинок в секунду — это хорошо, практически реалтайм. А если компрессор работает с парой кадров в секунду, то это 15-кратные тормоза в перекодировании и полуторачасовой фильм будет сжиматься сутки