Нажмите "Enter" для пропуска содержимого

Индекс динамических сцен: компьютерная и бытовая техника (телевизоры, ноутбуки, планшеты), фитолампы для растений»

Содержание

компьютерная и бытовая техника (телевизоры, ноутбуки, планшеты), фитолампы для растений»

Рассмотрим что такое индекс динамичных сцен и как он технически работает на телевизоре. Данное описание подходит для  индексов динамичных сцен любого производителя.

Производители телевизоров патентуют собственные названия индекса:

Clear motion rate (CMR), Picture Quality Index (PQI) в TV Samsung

Picture Mastering Index (PMI) в TV LG

Perfect Motion Rate (PMR) в TV Philips

Motionflow XR в TV Sony

Active Motion & Resolution(AMR) в TV Toshiba

Backlight scanning BLS-cканирующая подсветка в TV Panasonic

Clear Motion Index (CMI) в TV Thomson

Subfield Motion в plazma Samsung

 

Эти технологии оценивает качество показа динамичных сцен, чем выше индекс тем более естественную  картинку должен показать телевизор. Но телевизор изначально может показать не более 240 кадров в секунду больше не позволяют технические характеристики матриц экранов. Да и  стандарты записи видео оговаривают, что максимально устройства видеозаписи могут записать видео с частотой не более 60 кадров в секунду. 

Стандартное изображение на большинстве моделях телевизоров имеет частоту обновления 60 раз в секунду. Данная величина способна обеспечить достаточно четкое, контрастное и яркое изображение происходящего на экране. А в новейших телевизорах, которые поддерживают Ultra HD разрешение, картинки отличаются еще более насыщенными цветами. К этому стоит добавить, что на экране кинотеатра изображение сменяется со скоростью 24-25 раз в секунду. Отсюда вопрос – тогда зачем нужна еще большая частота кадров, если и так все хорошо видно? Ответ на этот вопрос заключается в некоторых фактах, которые и представят все преимущества данного параметра. 

Рассмотрим характеристики динамичного, быстро изменяющегося изображения, транслирующегося по стандартному жидкокристаллическому экрану телевизора. Можно вспомнить канал о животных, на котором гепард стремительно преследует антилопу или всевозможные опыты из популярных программ канала Дискавери. Оказывается, что для качественного просмотра всех движений, происходящих  в передачах, будет недостаточно 60 Гц, являющихся стандартным параметром для большей части телевизоров. Особенно это может быть заметно в спортивных передачах: безусловно, вратарь, отбивающий летящую шайбу, будет различим на поле, а вот сама шайба может быть и незаметной. И такая ситуация характерна для экранов с низкой частотой. Именно из-за низкой частоты кадровой развертки динамические объекты выглядят размытыми, теряют резкость и за ними становится трудно наблюдать. Они могут отображаться и по-другому – дискретно. В данном случает это будут резкие, оторванные друг от друга движения, которые как бы оторваны друг от друга. Такой вариант также не способствует качественной оценке изображения.

Отсюда вопрос – можно ли каким-либо способом изменить ситуацию и сделать изображение максимально реалистичным? Конечно, это возможно осуществить при помощи увеличения частоты смены кадров. Именно этот параметр позволит усилить четкость и контрастность предметов, находящихся в движении.

У кого-то возникнет вопрос: «Откуда берутся недостающие кадры, которые превращают несколько разреженных кадров в единое целое плавное движение? Известно, что источник видеосигнала не занимается их передачей». Ответ может кого-то удивить, но  он звучит так: недостающие кадры приходится «выдумывать». И занимается этой деятельностью специальный чип – «криэйтор» — видеопроцессор. Он отвечает за создание новых кадров и вставкой их между уже существующими, промежуточными. Кроме этой функции, видеопроцессор успевает заниматься и другими, не менее полезными делами: шумоподавлением, коррекцией цветопередачи, увеличением резкости изображения. 

Копнём глубже и рассмотрим с какой реальной частотой может работать современный LED телевизор.
Как правило, в телевизорах применяется матрица изготовленная по IPS технологии или её модификация, матрицы по этой технологии обеспечивают хорошую цветопередачу порядка 99% и углы обзора 178° как по вертикали, так и горизонтали что не мало важно для просмотра телевизора, ведь не всегда телезритель сидит прямо перед телевизором.

Проведя несложные вычисления можно определить следующее: отклик матрицы IPS порядка 5 мс, следовательно 1000/5=200 кадров в секунду. Стандартная матрица телевизора может показывать в секунду около 200 кадров, но это в идеале, на практике время отклика может быть и больше, например 7 миллисекунд.

Производители устанавливают в телевизоры матрицы 3 типов

Матрицы которые могут показать 60 кадров в секунду

Матрицы которые могут показать 120 кадров секунду (наиболее распространённые типы матриц)

Матрицы которые показывают 240 кадров в секунду (как правило устанавливаются в дорогих моделях)

 

Какая частота кадров в различных стандартах (надо представлять для последующего понимания принципа работы). 

1080i: чересстрочный стандарт с кадровой частотой 25, (29,97) или 30 кадров в секунду

1080p: стандарт с прогрессивной развёрткой допускающий использование кадровых частот 24, 25, 30, 50 или 60кадров в секунду

720p: стандарт с прогрессивной (построчной) развёрткой, допускающий использование кадровых частот 50 или60 кадров в секунду

SD: стандартное цифровое телевидение 50 или 60 кадров в секунду.

Аналоговый сигнал: 25 кадров в секунду.

 

Телевизор не имеющий индекса динамичных сцен

В таком телевизоре показывается изображение с той частотой кадров, с которой он принимает сигнал, в телевизоре не производится никакой коррекции или улучшения сигнала. Как правило ведущие производители телевизионной техники уже не выпускают телевизоры без индекса динамичных сцен.

Индекс динамичных сцен 100

В телевизорах имеющих индекс динамичных сцен 100 улучшение изображения происходит за счёт добавления 1 кадра между существующими двумя. Как правило идентичного существующему. Если в телевизоре применена 60 Гц матрица, то улучшение изображения можно увидеть только при просмотре изображения с частотой кадров менее 60. Если показывается изображение с частой 60 кадров технически не возможно его уже улучшить. 

Индекс динамичных сцен 200

В основном та же суть, что и при индексе 100 меняется только сам алгоритм обработки изображения процессором. 

Индекс динамичных сцен 400-600

В телевизорах с индексом динамичных сцен 400-600 добавляется между существующими кадрами уже 2-3 кадра, и применяется матрица поддерживающая частоту 120 Гц. Какие создаются промежуточные кадры между реальными, идентичные или вновь созданные зависит от алгоритма работы процессора, но учитывая то, что в телевизорах с индексом динамичных сцен что 100, что 400 применяются одинаковые процессоры, то можно предположить что создаются одинаковые повторяющиеся кадры. Также при таких индексах обязательно применяется локальное затемнение.

Теоретически возможно уже улучшить даже изображение высокой чёткости, хотя на практике по отзывах пользователей этого  не заметно. 

Индекс динамичных сцен 800-1200

В телевизорах с такими индексами динамичных сцен применяются уже матрицы повыше классом способные показывать более 120 кадров в секунду, а также устанавливаются более быстродействующие процессоры позволяющие, проводя анализ кадра, создавать промежуточные кадры не только идентичные, но и создавать индивидуальные промежуточные анализируя реальные кадры.

По отзывам владельцев телевизоров с различными индексами складывается следующая картина, разница действительно наблюдается по качеству отображения динамических сцен в телевизорах, например, с индексом 100 и 200, но уже свыше 400 или 600 разница незаметна и это можно уже отнести к маркетинговым уловкам производителей.

К тому же, телевизор не всегда правильно может произвести конвертацию или создание промежуточных кадров и иногда улучшенное изображение может быть по качеству хуже изначального. На картинке показать предмет в движении и сказать, что создаются несколько новых промежуточных это одно и совсем другое создать реальный, очень часто при создании промежуточных кадров создаются так называемые цифровые артефакты. 

На сегодняшний день ведущие мировые компании по производству электронной техники используют частоту кадров в секунду, равную 200.  Это фирмы Samsung, LG и Sony. Как они достигают такой мощной величины? Для того, чтобы телевизор выдавал настоящие 200 кадров в секунду, видеопроцессоры (как правило, в количестве двух штук) между последовательными кадрами стандартного видеопотока в 50 Гц вставляют еще три промежуточных изображения.

В результате новой высокотехнологичной процедуры динамические сцены обрели совершенно новое видение. Технология 200 Гц позволит в мельчайших деталях рассмотреть сложный маневр футболиста или стремительный удар боксера. Теперь любой спортивный матч по телевизору – это настоящий праздник, создающий полное ощущение присутствия на стадионе или в спортзале. Следует заметить, что фаворитами новой технологии являются не только спортивные телепередачи, но и все фильмы, подразумевающие стремительность и скорость. Игроманы, имеющие телевизор с частотой обновления 200 Гц, также будут счастливы от реалистичности того мира, в который играют.

Однако не все производители такие честные и пошли по пути честной развертки в 200 Гц. Кое-кто предпочел «обходной» маневр, предлагая нечто отличное от 200-герцовой развертки, но именуемое именно этим термином.

Как было сказано выше, честный производитель использует следующую схему улучшения качества динамического изображения: метод интерполяции данных MEMC, основанный на создании дополнительных кадров. Другие же изготовители, прикрывающиеся громкой величиной частоты обновления кадров своих экранов в 200 Гц, используют другой метод, ничего общего с увеличением частоты кадров не имеющий. Они применяют технологию гашения задней подсветки (Scanning Backlight — так называемая технология сканирующей подсветки). Использование этой технологии объясняется ее способностью устранять эффект размытости динамичного изображения. 

Что же касается частоты, то у телевизора, имеющего псевдо-200 Гц режим, и работающего по технологии Scanning Backlight, реальная частота обновления кадра равна 100 Гц. Экран при этом делится на три части горизонтали, в которых задняя подсветка включается и выключается. Для того, чтобы изображение с частотой обновления в 100 Гц смотрелось как изображение с оригинальной частотой обновления в 200 Гц, к картинке на экране просто добавляется «бегущий» с частотой 100 раз в секунду темный прямоугольник. Кончено, данная инновация ничего общего с подлинной частотой кадров в 200 Гц не имеет. Естественно, что эта технология значительно дешевле первой, рассмотренной выше.

 

Сторонники метода, базирующемся на затемнении подсветки  экрана, утверждают, что черные вставки помогают минимизировать эффект размытости объекта, который находится в движении, делая контуры более четкими в промежуточных кадрах. Также гашение лампы позволяет немного снизить расход электроэнергии.

Но поклонники именно этого метода сглаживания изображения не говорят о его недостатках. А они есть, и немалые. Во-первых, плавность  динамичных сцен не становится большей, так как  зритель видит такие еже 100 реальных кадров в секунду, как и без этой технологии. Во-вторых, гашение ламп снижает общую яркость изображения. А в-третьих, Scanning Backlight выводит на экраны телевизоров мерцание и размытость, заставляя нас мысленно возвращаться в то время, когда кинескопные телевизоры правили бал.

Таким образом, пополнение  видеоряда промежуточным кадром видимо улучшает восприятие всего происходящего на экране. В большей степени это качается сцен, в которых ведущие «роли» играют быстро движущиеся предметы или персонажи. Привлекательности этой технологии добавляет возможность регулировки степени обработки промежуточных изображений, которая может использоваться практически всеми:  и любителями спорта, и ценителями фильмов, и искушенными геймерами. Но все эти достоинства в полной степени раскрываются и реализуются только в телевизорах с настоящей 200-герцовой частотой смены кадров а это как правило телевизоры PREMIUM сегмента.

Советы по выбору 4K телевизора

Какое-то время тому назад я интересовался советами по выбору оптимального телевизора с большой диагональю (55″ в моём случае) здесь и на скутер-клубе. С покупкой в итоге определился, не жалею, и хочу поделиться опытом с вами — может кому  и пригодится.

Размер диагонали

Итак, размер диагонали 55″. Чтоб вы немного представляли себе в цифрах, это 1240 мм. Для справки, ширина дверного проёма современных автобусов составляет 1250-1400 мм.

С одной стороны, если рассматривать этот телевизор как придаток к компьютеру, так это чудовищно большой монитор. 🙂 Вот так он, к примеру, смотрится у меня на стене (на столе мониторы 22″ и 19″ соответственно):

А с другой стороны, во время просмотра фильмов (разумеется, сидя на диване, а не за рабочим столом) словил себя на мысли, что можно было и побольше диагональ брать. В кинотеатре пропорции, по сути, такие же. Вот только 65″ по сравнению с 55″ стоит непропорционально дороже, пришлось ограничиться тем, что есть.

Разрешение экрана

Второй важный критерий для телевизора таких размеров — обязательное наличие разрешения экрана не меньше 4K.

Я пересмотрел достаточно вариантов, чтоб утверждать наверняка: обычный FullHD на диагонали 55″ смотрится очень ущербно (да, я сказал это — «обычный FullHD»!). Его можно брать только в том случае, если вы будете смотреть с расстояния не меньше 3 метров.

Причём, заметьте, я говорю даже не про 4K контент, которого пока мало. Я говорю про обычное изображение — одно и те же 1080p видео на экране 4K уже смотрится выигрышнее. При наличии хорошего зрения вы уже с двух метров будете замечать пиксели на экране (55″ — слишком много для 1920 пикселей).

И если на то пошло, то 4K UHD (UltraHD, он же 4K, он же 2160p) сейчас стремительно набирает популярность. Уже и каналы Ultra HD 4K появились, а разговаривал с телевизионщиком — так он сказал, что сериалы российские и те уже в 4K снимать начали. Так что год-два, и никто не будет удивляться «зачем такое большое разрешение».

3D

После множества обсуждений и сравнений окончательно определился: 3d не нужен. Во-первых, в итоге получается не столько эффект объёма, сколько эффект аквариума. Во-вторых, стоит немного сдвинуться от центрального места — уже появляются искажения, с друзьями не посмотришь. Ну и в-третьих, несовершенна ещё эта технология, как ни крути.

Если уж так хочется объёма, то лучше сходить в кинотеатр. А так в итоге очки будут просто бесполезно пылиться на полке, как у большинства «счастливых обладателей».

Изогнутый экран

Очень выигрышно смотрятся телевизоры с изогнутым экраном. Футуристично, необычно, крайне современно. И должен признать, эффект объёма там действительно присутствует (особенно на правильно подобранных видеороликах).

Есть только один минус, из-за которого я отказался от рассматривания подобных моделей: это телевизор для эгоистов. 🙂 Эффект объёма и все преимущества там сохраняется только для тех, кто сидит непосредственно перед телевизором. Для остальных же зрителей изображение выглядит хуже, чем если бы они сидели перед обычным плоским экраном.

Тип матрицы

Сейчас почти все матрицы доведены до ума и отличаются разве что маркетинговыми цифрами. Тем не менее с учётом именно своих потребностей я остановился на IPS:


  • я планирую смотреть с 2 метров и не в одиночку, а у IPS самые большие углы обзора;

  • цветопередача, чем тоже славны IPS, играет не последнюю роль;

  • глубина же черноты чёрного цвета не особо беспокоит.

Конечно, можно было бы посмотреть в сторону OLED… Но там цена уже в разы больше, это уже совсем не бюджетный телевизор получится.

Индекс качества динамичных сцен

Когда вы уже определились с матрицей, диагональю и прочими основными параметрами, на первый план выходит параметр под названием «индекс качества динамичных сцен«. Этот параметр представляет собой комплекс программных и аппаратных мер, применяемых производителями для улучшения качества динамичных сцен (увы, это всегда было больным местом ЖК технологий). Понятное дело, чем он выше, тем лучше. Но, соблюдая разумное соотношения качества и цены, рекомендую выбирать телевизоры в районе значения индекса 1400.

Производитель

Если пытаться искать что-то в каталогах, то создаётся впечатление о повальном засилье LG. С одной стороны это так и есть, а с другой — у LG просто огромная линейка моделей телевизоров, многие из которых отличаются только разными мелочами, вроде подставки или отсутствием какого-нибудь разъёма, которым вы всё равно никогда не будете пользоваться.

Впрочем, в моём случае выбор матрицы определил выбор производителя — IPS для 4K в основном только у LG.

Было высказано много мнений «бери только Samsung, ни в коем случае не LG!», однако ни один из адептов не смог предоставить весомых доказательств своей точки зрения. Техподдержка везде одинакова, начинка тоже, по сути разница только в логотипе.

Звук

Родной звук в телевизорах — совсем ни о чём. Так, новости посмотреть, фильмы какие без претензий ко звуку. Во всех остальных случаях лучше отдельная аудио-система.

Производителей можно понять. Если утяжелить телевизор хорошей аудио-системой, то он теряет конкурентоспособность. Кто может себе позволить более дорогой телевизор, у того скорее всего всё равно купит внешнюю аудио-систему. А кто не может себе позволить, тому и с обычным звуком вполне подойдёт.

Страна сборки

Я не могу сказать, почему обычно отговаривают от российской сборки: либо потому, что мы привыкли хаять всё отечественное, преклоняясь перед заграницей, либо потому, что российская сборка действительно проигрывает по качеству… Я не знаю, не берусь судить. Рекомендуют не брать. А как по мне, так всё равно — лишь бы гарантия была.

Покупка и впечатления

С учётом всех перечисленных параметров под мой выбор оптимально подошла модель LG 55UF771V. Стало даже немного обидно, когда в одном из видео-обзоров услышал фразу: «Если вы собираетесь выбирать — не надо, мы это уже сделали за вас!»

Но в итоге купил LG 55UF7787: практически то же самое, отличается только подставкой и чуть более высокой динамической контрастностью. И сборка польская (хорошо хоть гарантия белорусская).

Повесил его на стену на поворотный кронштейн. Обычное положение — над рабочим столом, в случае просмотра с друзьями можно выдвинуть вперёд и на полметра вправо, чтоб находился примерно по центру комнаты.

По впечатлению — получил несколько больше, чем планировал. Если вначале думал его использовать только как придаток к компьютеру, то сейчас признаю, что это — вполне себе самостоятельное устройство даже без подключения к телевизионным антеннам. Главное, чтоб было подключение к интернету. У меня он подключен через WiFi.

Скорости интернета в 10 Мбит оказалось вполне достаточно, чтоб без тормозов смотреть 4K ролики из Vimeo. Встроенный браузер не тормозит, а Smart-пультом оказалось очень легко и удобно пользоваться. Иногда только хочется подключить отдельную клавиатуру (или мою беспроводную каким-то образом расшарить на два устройства).

Ещё пока не определился, с помощью какого приложения искать фильмы. Megogo и tvzavr в паре хороши — платное в одном может оказаться бесплатным в другом, но у каждого из них есть свои недостатки. Надо будет отдельный пост на эту тему создать, может присоветует кто чего.

Picture mastering index 1600 гц что это

В LED телевизорах для улучшения качественных показателей изображения применяются технологии PMI. Это индекс, который определяет визуальное восприятие динамических сцен, что не означает частоту воспроизведения картинок. Считается, что синхронизация реальной частоты обновления телевизионной матрицы и частоты мерцания подсветки экрана дает более равномерную и детализированную динамическую картинку.

Аббревиатуру PMI использует компания ЭлДжи. У других производителей эта технология называется по-разному:

  • CMR – Самсунг;
  • AMR – Тошиба;
  • CMI – Томсон;
  • PMR – Филипс;
  • MXR — Сони.

Однако технически индекс динамических изображений в телеаппаратах разных изготовителей работает одинаково.

Зачем нужны высокочастотные телевизоры

Раньше для описания частоты кадров телевизора использовались Герцы (200, 400, 800 и т.д.), но это нельзя назвать правильным. Сейчас изготовители отдельно прописывают индекс зрительного восприятия динамических сцен и частоту кадров матрицы телевизора. К примеру, 1900 PMI/500 Гц.

При частоте выше 50 Гц мерцание экрана не заметно человеческому глазу. Тем не менее, изготовители производят приборы с частотой матрицы 100-240 Гц. Это необходимо для того, чтобы убрать эффект мигания в аппаратах, использующих 3D технологию и программы повышения частоты кадров в динамичных изображениях.

При использовании активной 3D технологии происходит поочередное затемнение для правого и левого глаза. При этом частота уменьшается в два раза. Это значит, что при трансляции кинофильма с частотой 60 кадров/сек. экран будет мерцать. Этот эффект убирается путем демонстрации двух идентичных кадров, которые дублирую друг друга. Для данной технологии применяются матрицы, частота которых составляет 100-120 Гц.

Высокая частота также важна для тех, кто пользуется телевизором как монитором для видео игр, при условии присутствия сцен с частотой более 60 кадров/сек. Тогда идеальным вариантом будет аппарат с матрицей от 120 Гц до 240 Гц.

Если говорить об обычных телевизорах, то мерцание будет ощущаться только при просмотре изображения, отснятого с частотой ниже 30 кадров/сек. Для существенного улучшения восприятия видео необходимы дополнительные кадры.

Разновидности телевизоров по показателю PMI

Показатель PMI в телевизорах LG может быть различным. Аппараты, не использующие данную технологию, уже не выпускаются, тем не менее, они есть у некоторых потребителей. Здесь нужно знать, что картинка в таком телевизоре показывается с частотой приема сигнала без производства коррекции.

Что касается технологий 100 и 200 PMI, то они работают практически одинаково. Это значит, что для улучшения изображения между двумя существующими кадрами добавляется еще один. Разница между двумя показателями заключается в алгоритме обработки изображения, осуществляемом процессором. Используемая матрица поддерживает частоту 60 Гц.

Говоря о технологиях 300, 400, 450, 500 и 600 PMI нужно отметить, что это значит, что между основными вставляются уже два-три добавочных кадра, а частота применяемой матрицы составляет 120 Гц. В зависимости от работы процессора, дополнительные кадры могут быть идентичными основным или отличными от них. Кроме этого, для таких индексов характерно применение локального затемнения. Теоретически данная технология позволяет улучшить изображение динамичных сцен, однако на практике рядовые потребители этого не замечают.

Технология в телевизоре 1000, 1200, 1600, 1900 PMI и выше показывает, что это характеризуется наличием матрицы с частотой выше 120 Гц и применением более быстрых процессоров. После анализа реальных кадров они производят новые, отличные от них. Как и при более низких индексах динамических изображений, индивидуальные кадры вставляются между реальными.

Показатель PMI и выбор телевизора

По большому счету, при выборе телеаппарата уделять индексу PMI существенное внимание нет необходимости. Данный показатель скорее является маркетинговым ходом, а не реальной технической характеристикой, тем более что разные изготовители трактуют его по-своему, а единых стандартов нет.

Обращать внимание на PMI следует только при покупке телевизора LG, сравнивая изделия различных линеек. Предельное значение показателя динамичных сцен в аппаратах этого производителя может составлять 2000 PMI. Компания гарантирует показ более естественного изображения при повышенном PMI. Соответственно, чем выше этот индекс, тем телевизор будет стоить дороже.

Чтобы проверить, насколько работает данная технология, необходимо закачать на флэшку видео, где присутствуют динамичные сцены, например, движение машины по автотрассе. Качество видео должно быть Full HD 1920х1080. Затем при выборе телевизора в магазине нужно попросить продавца воспроизвести это видео на приборах с разными PMI. Если существенной разницы нет, то можно покупать более дешевый телевизор с более низким индексом динамичных сцен.

Производители телевизоров с мировым именем каждый год выпускают все новые и новые модели техники, которые более умные, чем их предшественники.

Новые модели имеют значительно больше параметров, которые при выборе нужно обязательно учитывать. Существует множество различных технологий телевизора, к примеру, технология Led телевизора, технология Nano cell, технология Hdr Samsung и др., поэтому нужно иметь представление о них.

Технология 4K

Ультрасовременная технология ULTRA HD 4K, которую используют мониторы и проекторы, отличается от известных форматов HD и Full HD количеством пикселей в составе изображения, а также их размером.

Данная технология стремительно набирает популярность. Известно, что картинка будет тем качественней, чем больше пикселей в ней содержится и чем мельче они имеют размер.

Благодаря этому можно будет рассмотреть намного больше мелких элементов. В том случае, если изображение будет иметь меньшее разрешение, телевизоры 4К, даже с диагоналями 32 дюйма, его будут показывать лучше, чем HD и Full HD.

Это объясняется тем, что на экранах с такими технологиями в составе изображения число пикселей больше. Важно понимать, что изображение нужно увеличить тем больше, чем мельче элементы в его составе.

Только так можно рассмотреть его максимально подробно. Этим и объясняется то, что при переходе на формат 4К лучше отдавать предпочтение моделям телевизоров, у которых больший экран.

Технология 4К – это высочайшее качество, а также четырехкратное увеличение объема элементов, если сравнивать с технологией Full HD.

Что такое HDR

Уникальная технология High Dynamic Range (HDR) представляет собой новейшие стандарты видеосигнала, разработанные специально для моделей, выпущенных в последнее время. Это такой формат видео, в котором каждый пиксель имеет сверхвысокое разрешение, больше информации про яркость и цвет.

Но далеко не все телевизоры имеют возможность поддерживать такую технологию, для нее нужны плазменные экраны и видео, снятое и обработанное специально.

Технология обеспечивает передачу на экран более живой и реалистичной картинки. Кроме этого, больше не будет ограничений, как это было в более старых моделях телевизоров.

К основным преимуществам технологии можно отнести такие:

  • богатейшую оттеночную палитру;
  • яркость более широкого диапазона.

Ошибочно считать схожими технологию HDR в телевизоре и эффект фото, где один снимок с имитацией расширенного диапазона создается путем комбинации нескольких фото.

Что касается телевизора, то видео снимается в HDR-формате изначально. Это и обеспечивает картинку, которая выглядит максимально живо и реалистично.

Что такое технология LED телевизора

Технология изготовления экрана прибора определяет уровень качества при передаче картинки.

На сегодняшний день панели бывают двух видов:

  1. Матрицы жидкокристаллические при наличии светодиодов (LED). Преимущества led телевизоров в том, что использование производства лед обеспечивает отличную цветопередачу, контрастность и четкость изображения, широкий угол обзора.
  2. Матрицы с органическим светодиодным экраном (OLED). Данная категория более совершенна. Здесь отдельный пиксель представляет собой светодиод, который может светиться самостоятельно, благодаря чему обеспечивается максимально точная светопередача и контрастность.

Технология Oled телевизоров способна передавать до миллиона цветовых оттенков, что больше Edge led-технологии в 64 раза. Что касается глубины черного, то ее обеспечивает отключение некоторых пикселей на экранах, которые не задействованы.

У данной технологии значительно больше угол обзора шире, если же говорить про толщину панелей, то она значительно тоньше. Если говорить про скорость обновления изображения дисплеями oled, то она в разы выше, что обеспечивает высокую точность изображений, которые двигаются.

Технология PMI

С целью улучшить показатели качества изображения в телевизорах LED применяется такая технология, как PMI. Она определяет визуальное восприятие динамических сцен, другими словами, с какой частотой будут воспроизводиться изображения.
Благодаря синхронизации частоты обновления матрицы реальной с частотой мерцания подсветки экрана телевизора, обеспечивается более детальная и равномерная картинка.


Эта технология у разных производителей носит разное название: CMR (Самсунг), CMI (Томсон), AMR (Тошиба), PMR (Филипс), MXR (Сони), но работает технология одинаково.
Еще совсем недавно, чтобы описать частоту кадров телевизора, использовались Герцы, что не совсем верно. На сегодняшний день производители начали отдельно прописывать частоту кадров матрицы и индекс зрительного восприятия динамических сцен современных телевизоров.

Мерцание с частотой выше 50 Гц наш глаз не способен уловить, но производители делают телевизоры, у которых 100-240 Гц частота матрицы. Благодаря этому достигается устранение эффекта мерцания в телевизорах, которые используют программы для повышения частоты кадров в динамических картинках и технологию 3D. Это используют в технологии квантовых точек.

В разных моделях телевизоров разных производителей показатель PMI может отличаться. Сейчас самые известные производители уже не выпускают телевизоры, где не используется данная технология.
Работа технологий 100 и 200 PMI практически не отличается между собой. С целью улучшить изображение между двумя кадрами, производится добавление еще одного.

Обработка картинки процессора определяет разницу между двумя показателями. Применяемая матрица поддерживает частоту 60 Гц. Что касается технологий 300, 400, 450, 500 и 600 PMI, то между основными кадрами вставляется еще два дополнительных, при этом показатель частоты на уровне 120 Гц.

Технологии 1000, 1200, 1600, 1900 PMI и выше имеют матрицу с частотой выше 120 Гц, в приборах применяются процессы, характеризующиеся высоким быстродействием. Анализируя реальные картинки, способны воспроизвести новые кадры.

Технология PQI в телевизоре: что это

При выборе не нужно сильно задумываться о телевидении Pqi (его индексе), ввиду того, что эта характеристика не является технической и для нее не существует единых стандартов.
Для проверки работоспособности технологии, нужно закачать видео с динамичными сценами на флешку и попросить, чтобы продавец телевизора поставил ее на телевизоры с разными индексами PMI.
Наличие всех перечисленных технологий в современном телевизоре – это широкие возможности и высокая цена.

Названия систем обработки изображения различных брендов тв.

  • Active Motion & Resolution(AMR) — TV Toshiba
  • Clear motion rate (CMR) — TV Samsung
  • Motion Clarity Index (MCI),Ultra Clarity Index (UCI) — TV LG
  • PMI индекс улучшения изображения (Picture Mastering Index) в телевизорах LG с июня 2015
  • Motionflow XR — TV Sony
  • Backlight scanning BLS-cканирующая подсветка в TV Panasonic
  • Clear Motion Index (CMI) — TV Thomson
  • Perfect Motion Rate (PMR) — TV Philips
  • Subfield Motion — plazma Samsung

Все вышеперечисленные технологии не имеют ничего общего с реальной частотой кадров, а являются неким индексом определяющим визуальное восприятие изображения.

Например раньше в описании частоты кадров телевизора можно было встретить 400-500-800 Гц, что не совсем верно, то теперь некоторые производители начали указывать отдельно точную частоту кадров и показатель системы обработки изображений.

Так в телевизорах LG можно увидеть следующие технические характеристики 1000 UCI/100 Гц, либо 2000 PMI/200 Гц, где параметр UCI и PMI относятся к системам обработки изображения, а 100, 200 Гц точная частота кадров матрицы телевизора.

Количество герц в матрице телевизоров.

Человеческий глаз воспринимает частоту свыше 50 Гц как постоянную составляющую и не замечает мерцания. Тогда возникает вопрос а зачем производители выпускают телевизоры с частотой матрицы 100,120,200,240 ГЦ.

Повышение частот нужно для убирания эффекта мерцания в телевизорах с активным 3D и в тв с системами увеличения частоты кадров в динамических сценах.

При включении активной технологии 3D в телевизорах, экран поочередно затемняется для левого и правого глаза, что приводит к уменьшению частоты ровно в два раза. Поэтому если транслировать фильм в 3D с частотой в 60 кадров в секунду, то телезритель увидит мерцание. Чтобы убрать данный эффект показывается два одинаковых кадра (дублирующих друг друга). Для этой технологии необходимы матрицы с повышенной частотой 100-120 Гц.

В обычных тв без 3D, в фильмах снятых с частотой 60 кадров в секунду дополнительные кадры совершенно не нужны, а вот если исходный материал снят с частотой менее 30 кадров в секунду, то дополнительные кадры существенно улучшат восприятие видео.

Еще телевизоры с повышенными частотами пригодятся тем, кто использует тв в качестве монитора для видео игр. В случае если в играх присутствуют сцены с частотой кадров более 60 в секунду, то телевизор 120 Гц матрицей и более, предпочтительней во избежание различных артефактов.

И так, что касается герц в телевизоре, для просмотра тв передач и видео достаточно частоты матрицы 60 Гц, для 3D и использования телевизора в качестве монитора при видео играх выбирайте телевизор с повышенными частотами 100-240 Гц (240 гц на сегодня является максимальным значением ).

Значение систем обработки изображения.

Если говорить о параметрах систем обработки изображений описанных в начале статьи, то вам нужно понять следующее, все они созданы для улучшения восприятия изображения хоть и имеют разные названия и величины.

Производители по сути используют этот параметр в маркетинговых целях. Например с июня 2015 компания LG ввела новое название PMI (Picture Mastering Index) — индекс улучшения изображения, максимальное значение которого может достигать 2000 PMI. Но дело в том, что пока никто не знает как считается данный индекс и данный переход на новый индекс с большим числовым значением скорее всего вызван желанием продать больше телевизоров, так как покупатель конечно же обратит внимание на модель с большим показателем.

Какими бы не были технические значения тв выбрать лучший телевизор вам поможет нехитрый способ.

Закачиваем на флешку видео с динамическими сценами качества Full HD 1920*1080(видео с быстрым движением объектов), например авто трасса с быстро проезжающим авто либо сцены драк где актеры выполняют резкие движения. Далее идем в магазин и просим менеджера включить видео с флешки на понравившемся телевизоре. Таким образом можно сравнить качество изображения тв с разными показателями герц и систем обработки изображения не обращая внимания на цифры.

Если перед вами два телевизора одного размера с частотами 100 Гц , но разными значениями систем обработки изображения,при этом они показывают динамические сцены одинаково хорошо, то выбирайте тот который дешевле — зачем платить за большие цифры которые по сути не на что не влияют.

Выбираем 4K-телевизор для дома

Технологические прорывы в ближайшее время не ожидаются, производители оттачивают существующие наработки, увеличивая диагонали экранов и снижая цены на те, что поменьше. 4K шагает по планете, но в нашу Синеокую сверхвысокое разрешение пока заглядывает лишь мельком: белорусские телеканалы только перешли на HD-вещание, которое делает изображение чуть более привлекательным на современном телевизоре.

Впрочем, телевизионный контент не слишком нуждается в умопомрачительной картинке — смотреть новости о высоких надоях или открытии очередного торгового центра можно и в стандартном разрешении.

Красивый и умный

«Развлекалово» должно быть ярким, красивым и звучать хорошо. Кроме того, многие покупают телевизор всерьез и надолго, и если года два назад приобретать модель c 4K-экраном не было смысла (как минимум, дорого), то сегодня цены на них находятся примерно на том же уровне, что и на телеприемники с экранами формата Full HD в то время. Да и контента под него все больше: стриминговые сервисы его уже вовсю предоставляют, белорусские операторы также планируют начать (кто-то уже даже транслирует), хоть и в очень ограниченных объемах. Поэтому теперь есть смысл переходить на телевизоры с UHD-экранами.

Базовый момент — «умность» телевизора. В первую очередь она необходима для использования всех прелестей современного IPTV, причем необязательно того, который предлагает ваш интернет-оператор: существует множество конкурентоспособных ТВ-сервисов по привлекательной цене и с широким выбором 4K-контента с HDR (Amazon Prime, Netflix). Есть и иные, более доступные источники — главное, чтобы интернет-канал был «широкий». Ну и Smart TV дает зеленый свет дополнительным возможностям в виде серфинга по интернету, просмотра YouTube и так далее. Главное, чтобы не тормозил.

За Smart TV, в зависимости от производителя, отвечают Tizen, WebOS и Android, а также другие, менее распространенные ОС. Все 4K-телевизоры по умолчанию являются умными и получают «железо», которое обеспечивает комфортное взаимодействие с пользователем (не говоря уж об обработке видео). Android может быть представлен в виде специализированной ОС для ТВ или «обыкновенной» версии.

Для потребителя окажется удобной Android TV. «Простой» Android в теории более гибкий, но на деле могут возникнуть сложности с установкой некоторых приложений именно для взаимодействия с телевизором. Также отлично справляются с работой Tizen и WebOS последних версий. Остальные платформы Smart TV с высокой долей вероятности доставят рядовому белорусскому пользователю лишь проблемы.

Третья «фишка», если вы ориентируетесь именно на UHD-телевизоры, — поддержка HDR (10-битный цвет) и/или Dolby Vision (12-битный цвет). Однако технологии должны быть реализованы и в поставляемом контенте — играх, сериалах и фильмах, в том числе с помощью HLG для вещательного ТВ. Они позволяют убрать непроглядные черные тени и белые засветы в изображении, продемонстрировать во всей красе цвета и показать гармоничную картинку во всех ее деталях.

Однако заметить разницу можно далеко не всегда, а для Dolby Vision найти фильмы-сериалы-игры сложнее. Кроме того, где 10-битный, а где 12-битный цвет, вы вряд ли поймете. А если нет разницы, зачем платить больше?

Немало зависит от технологии матрицы. Наш выбор — за OLED. QLED от Samsung неплох, но это обыкновенная VA с дополнительным маркетинговым слоем квантовых точек. Обыкновенный VA может не впечатлить по углам обзора. Остается IPS, с которым также не все гладко: проблемы с равномерностью черного, худший в сравнении с VA контраст. На самом деле сказать, что одна технология превосходит другую (IPS или VA), нельзя — и там и там есть свои преимущества и недостатки.

В любом случае решающим фактором, который может повлиять на выбор, поддержка HDR не является, но есть она почти во всех UHD-телевизорах — главное, чтобы матрица поддерживала. Dolby Vision можно найти в более дорогих моделях.

Звуковой компонент — самая слабая сторона 90% телевизоров. Вся проблема в тонких корпусах, и сочного звука вы практически наверняка не дождетесь даже в топовых устройствах. Басы если и будут, то очень своеобразные — вялые, деревянные и невзрачные (в дорогом сегменте, конечно, ситуация лучше, но все еще далека от идеальной). Решение — подключить телевизор к домашней акустике либо прикупить в довесок саундбар.

Ненужное

Из «ненужного» — поддержка 3D, которая оказалась маркетинговым провалом. Производители уже отказались от этой технологии.

Насчет изогнутости экрана однозначного мнения нет. Да, он якобы позволяет глубже окунуться в происходящее, однако сидеть при этом придется так близко, что любая бабушка заругает. Кроме того, находиться необходимо на центральной оси, в противном случае могут наблюдаться искажения пропорций, картинка становится выцветшей. Отражение ярких внешних источников света в изогнутом экране может «поплыть», что сделает просмотр некомфортным, однако в дорогих телевизорах существуют фильтры и покрытия, снижающие эффект. Один из минусов OLED-экранов — они, как ни странно, иногда выгорают. Проблема может проявиться, если телеприемник в буквальном смысле работает сутками, а его владелец игнорирует рекомендации производителя по обслуживанию.

Зато выглядит такой телевизор технологично и красиво. По нашему мнению, изогнутость отчасти оправданна лишь на больших диагоналях (от 60 дюймов), но цена в этом случае подскочит ощутимо.

Диагональ

Размер экрана напрямую зависит от того, где будет установлен телеприемник. Однако есть здесь и субъективный момент: одни предпочитают находиться ближе к теплому излучению, другие — дальше. Очевидно, есть нюансы и с разрешением контента — чем ближе вы к крупному экрану (например, 50 дюймов), тем выше оно должно быть, с обязательным соответствием характеристикам матрицы. Тем временем многие ТВ-каналы и SD-контент могут вызвать культурный шок размерами пикселей. Да, UHD-телевизоры могут подгонять картинку меньшего разрешения под свой экран благодаря апскейлингу, который работает на удивление хорошо, хоть и не всегда.

Но стоит помнить, что из 720×576 пикселей белорусских телеканалов с не слишком эффективными кодеками вытянуть приемлемую картинку не получится. И да, часто плохая картинка появляется из-за нежелания настроить экран — яркость, контраст, насыщенность, температуру и так далее. То есть дорогой ненастроенный телевизор может показывать хуже, чем дешевый, но настроенный.

Если подходить с точки зрения «народной науки», проще всего рассчитать расстояние до устройства, умножив диагональ в сантиметрах на 2,5—3. Таким образом, от зрителя до 50-дюймового телеприемника с Full HD-матрицей должно быть чуть менее четырех метров. В случае с 4K разделите полученную цифру на два.

Но если не брать в расчет формулы, то экран должен полностью оказаться в поле зрения и не требовать от пользователя постоянного верчения головой и страшного закатывания глаз. Да и как показывает рынок, маленькие диагонали отмирают. Исключение составляют дачные варианты, а так — от 40 дюймов и выше. Некоторые производители попросту не совершенствуют те, что меньше, продолжая выпускать старые модели.

Цена? 4K-разрешение оказывается доступным на диагоналях до 50 дюймов. Есть финансовый запас? Тогда лучше отдать предпочтение телевизору с диагональю от 55 дюймов. Выбирать 55—65 дюймов с Full HD? Это возможный вариант, но с точки зрения практичности и финансов лучше прикупить телевизор лет на семь вперед и забыть.

Плавно и четко

За плавность картинки отчасти отвечает частота обновления экрана — чем показатель выше минимальных 50 Гц (60 Гц), тем лучше. В телевизорах применяется вставка дополнительного черного кадра или интерполяция, а также иные улучшайзеры. Когда их много, может проявиться феномен, именуемый в народе «эффектом мыльной оперы». Отметим, что иногда на коробках пишут об «эффективной частоте обновления» экрана, которая отчасти представляет собой маркетинговый ход — показатель завышен в два раза в сравнении с реальным. В сегменте подешевле, с небольшими диагоналями, найти «настоящие» 100 Гц не получится.

Стоит обратить внимание и на индекс динамических сцен. Опять же — чем он выше, тем лучше. Параметр отражает способность матрицы выводить без артефактов быстро сменяющуюся картинку. В топовых моделях он может составлять несколько тысяч единиц. Правда, есть одно «но» — это еще больший маркетинг, нежели всевозможные показатели контрастности и яркости. Но, конечно, «чем больше, тем лучше». Теоретически.

Разъемы

По интерфейсам при выборе 4K-телевизора все очевидно: от двух (лучше — четырех) HDMI, набор USB для флешек-мышек. Наличие Ethernet-подключения может стать необходимостью, если контент будет транслироваться из интернет-сервисов. Потребуются CAM-модуль и цифровые тюнеры (DVBT-2, «кабельный» DVBT-С и DVBT-S для спутника). Если планируется подключать внешнюю акустику, то следует уточнить, что за кабели в ней используются и имеются ли они в телевизоре, потому как нет ничего хуже переходников.

Бренды

Чаще всего в более выгодном свете предстают «народные» LG и Samsung, а также более дорогой Sony. Правда, может оказаться, что корейский аналог Sony будет ощутимо дешевле при тех же характеристиках. Но цена является решающим фактором не для всех. Как правило, в одной ценовой категории известные бренды предлагают одно и то же. Существуют менее распространенные бренды. В частности, TCL. Он является популярным за границей, но у нас распространен мало. Это дешевый вариант, не исключающий появления проблем. Бренд Philips может оказаться неплохим вариантом, но ему придется соревноваться с лидерами рынка.

Благодарим компанию ООО «Электросервис и Ко» за помощь в подготовке материала

Читайте также:

Наш канал в Telegram. Присоединяйтесь!

Быстрая связь с редакцией: читайте паблик-чат Onliner и пишите нам в Viber!

Перепечатка текста и фотографий Onliner.by запрещена без разрешения редакции. [email protected]

Лучшие телевизоры 2021 | Рейтинг экспертов Битпрайс

Xiaomi Mi TV 4S 43 T2 Global

Недорогой SMART с голосовым управлением

Отличный телевизор по соотношению цена-качество. Операционная система (Android) работает очень быстро. Пульт компактный, неплохой дизайн.

  • Бренд: Xiaomi
  • Страна-производитель: Китай

Плюсы и минусы Xiaomi Mi TV 4S 43 T2 Global

  • Качество картинки
  • Цена
  • Голосовое управление
  • Функционал
  • Удобство управления
  • Может подвисать при голосовом управлении

Haier LE24K6500SA

Недорогой на кухню

Отличный вариант небольшого телевизора на кухню или в маленькую комнату. Отличный смарт телевизор за небольшие деньги. 2 разъёма на флешку. Хорошая картинка. Функциональный пульт управления.

  • Бренд: Haier
  • Страна-производитель: Россия
  • Завод-изготовитель: TPV CIS

Плюсы и минусы Haier LE24K6500SA

  • Качество картинки
  • Цена
  • Неплохой звук
  • К пульту нужно привыкнуть

LG 43UK6200

Хороший звук

LG 43UK6200 — очень хороший телевизор за свои деньги. Смарт работает быстро. Картинка чёткая. Хороший объемный звук. Ножки у него действительно маленькие, е если вдруг случайно задеть, то может упасть, однако если вешать на стену или ставить близко к стене, то данный минус сводится на нет.

  • Бренд: LG
  • Страна-производитель: Россия
  • Завод-изготовитель: LG Electronics RUS

Плюсы и минусы LG 43UK6200

  • Объемный звук
  • Удобный интерфейс
  • Цена
  • Маленькие ножки

Philips 32PHS5505

Недорогой телевизор с качественным изображением

Отличный телевизор с диагональю 32 и разрешением 1366×768. Модель предусматривает светодиодную подсветку и стереозвук. Частота обновления экрана составляет 60 Гц. Угол обзора экрана — 178°. Устройство имеет прогрессивную развертку. Поддерживает: DVB-T, DVB-T, MPEG4, DVB-T2, DVB-C, DVB-C, DVB-S, DVB-S2, Телетекст. Мощность звука данного телевизора составляет 10 Вт. Акустическая система включает два динамика, также есть объемное звучание. При работе поддерживает форматы: MP3, WMA, MPEG4, MKV, JPEG.

  • Бренд: Philips
  • Страна-производитель: Россия
  • Завод-изготовитель: TPV CIS

Плюсы и минусы Philips 32PHS5505

  • отличный звук
  • цена
  • качество изображения
  • сложная установка каналов

Sony KD-55XH9505

Телевизор с высококачественным изображением

Sony KD-55XH9505 — телевизор с широкой диагональю 54.6″. Формат экрана 16:9, разрешение — 3840×2160. Отличное звуковое сопровождение обеспечивается за счет стереозвука. Модель имеет технологию Dolby Labs, созданную специально для видео с широким динамическим диапазоном. LED подсветка в сочетании с Direct LED исключает возникновение засветов, обеспечивает равномерность подсветки, высокую яркость и динамичную контрастность. Телевизор с Local Dimming – технологией локального затемнения экрана.

  • Бренд: SONY
  • Страна-производитель: Малайзия

Плюсы и минусы Sony KD-55XH9505

  • очень качественное изображение
  • звук
  • очень краткая инструкция

Thomson T40FSL5130

Хороший телевизор Smart TV по приемлемой цене

Телевизор с функцией Full HD. Модель имеет светодиодную подсветку Direct LED и стереозвук. Частота обновления экрана 50 Гц. Есть функция Smart TV. Акустическая система имеет два динамика. Есть несколько дополнительных функций: таймер сна и защита от детей, а также поддержка DLNA — позволяет совместимым устройствам передавать и принимать разный медиаконтент. Модель поддерживает CI, который используется для подключения электронных CAM-модулей.

  • Бренд: THOMSON
  • Страна-производитель: Россия
  • Завод-изготовитель: ПКВ

Плюсы и минусы Thomson T40FSL5130

  • функциональный
  • хороший звук
  • приемлемая цена
  • стильный дизайн
  • отсутствие Bluetooth

Samsung UE43TU8000U

Телевизор с голосовым управлением

Телевизор с высоким качеством изображения и разрешением 3840×2160. Модель оснащена стереозвуком и LED подсветкой. Частота обновления экрана 100 Гц. Платформа Smart TV относится к операционной системе Tizen. Индекс динамических сцен у данной модели – 2100. Предусмотрена прогрессивная развертка. Декадеры аудио Dolby Digital представляют целую систему многоканального звука, обеспечивает высококачественные оптические фонограммы. Дополнительно предусмотрено автоматическое выравнивание громкости.

  • Бренд: Samsung
  • Страна-производитель: Россия
  • Завод-изготовитель: Samsung Kaluga

Плюсы и минусы Samsung UE43TU8000U

  • качество изображения
  • быстрый отклик
  • голосовое управление
  • не поддерживает некоторые кодеки

Samsung UE32T5300AU

Смарт ТВ с соотношением цена/качество

Samsung UE32T5300AU — отличный телевизор с разрешением 1080p Full HD. Индекс динамических сцен у данной модели — 1000. Платформа SMART TV на основе Tizen. Тип затемнения экрана — Micro Dimming Pro, за счет локального затемнения делает изображение более контрастным, а черный цвет — глубоким. Телевизор поддерживает приложение TV Key, а также IPv6. Модель может быть установлена на стену. В качестве дополнительных функций предусмотрена защита от детей, таймер сна, датчик освещения и технология Airplay.

  • Бренд: Samsung
  • Страна-производитель: Россия
  • Завод-изготовитель: Samsung Kaluga

Плюсы и минусы Samsung UE32T5300AU

  • качественное изображение
  • хороший угол обзора
  • удобное управление
  • цена
  • не самый лучший звук

какой индекс частоты развертки лучше

При выборе телеприемника пользователю приходится сравнивать огромное количество характеристик. Информационные технологии выдвигают современную технику на передовые позиции. Частота обновления экрана телевизора — один из основных параметров выбора. Как от нее зависит качество изображения, влияние на здоровье человека, вы узнаете из нашей статьи.

Что такое частота обновления экрана телевизора

Функционал современных видеоустройств широк. Что именно хорошо в современном телеприемнике, а что — не очень? Раньше все сводилось к выбору кинескопной модели с частотой развертки, равной частоте мигания лампочки, и никто не думал, что может быть по-другому.

Теперь, кроме улучшения «умных» характеристик телевизоров, дисплей телеприемника способен обновлять картинку с высокой скоростью. 50 Гц ушли в прошлое. Инновационные изделия поддерживают частоту изменения картинок до 150—200 Герц и более. Эти числа обозначают количество изменяющихся кадров в аппарате за 1 сек.

Величина в герцах по паспорту показывает изменение картинок за 1 сек. матрицей телевизора. Кинескопные телевизоры с частотой мерцания 50 Гц не могли обеспечить четкой быстродвижущейся картинки. Размазанные картинки при моментальном перемещении объектов мешали восприятию глаза.

Позже появились ЭЛТ телеприемники с разверткой 100 Гц. Когда контент выдавался на скорости 50 Гц, новое оборудование лишь «интерполировало» недостающие кадры. Однако по сравнению со старыми телевизорами качество стало на высоком уровне, да и альтернативы не было.

Разница высокочастотных изображений по сравнению с низкочастотными в том, что продвинутый аппарат «дописывает» дополнительные кадры, заполняя ими основные.

Этим была решена проблема «мыльной оперы», когда во время показа динамических изображений с соревнований или гонок появлялась проблема размытости изображений, контуров предметов. Производители решили перейти к экранам с динамикой кадра 120 Гц. Проблема была решена.

Подделка кадров вносит дополнение в изображение. Для просмотра обычных нединамических сцен достаточно смены изображения на скорости 60 кадров в секунду.

Какая частота обновления экрана телевизора лучше

Человеческий глаз не разбирает мигание с видеочастотой выше 50 Гц. Именно поэтому такая цифра выбрана для освещения помещений — она не оказывает вредного влияния на зрение. Казалось бы, какая разница, с какой герцовкой покупать дисплей, если все изображения давно уже перешагнули этот допотопный стандарт? Некоторые продавцы магазинов не всегда способны ясно пояснить суть индекса частоты обновления в телевизоре. Но разница значительна. Достаточно добавить немного денег — получите отличную модель с плавными перемещениями быстрых кадров.

Хоть производители говорят, что частоты в 100 Гц для человеческого восприятия вполне хватает, но сами поднимают планку. И разница видна. Если установить рядом два монитора — на 100 и 200 Гц, сравнить изображение на телеприемниках с одинаковым разрешением экрана, — это станет откровением. 200-герцовый аппарат динамические картинки показывает абсолютно без погрешностей, торможения и посторонних эффектов.

Индекс подмены изображений называется динамической интерполяцией. Раньше он был универсальным, имел название CMR, измеряясь в герцах. Позже производители стали вводить свои поправки, используя разные технологии:

  • PQI — в компании Самсунг;
  • M0tionFlow — от японского концерна Сони;
  • TruMotion — единица измерения корейского производителя LG;
  • от компании Филипс — Digital и иные единицы.

Варианты раскадровок и методы их применения:

  1. Самые доступные — приемники с частотой 50-90 Гц. Это самый популярный, недорогой сегмент покупок. Статические сцены показываются хорошо. Динамические программы с быстро меняющимися картинками выглядят размытыми. Во время передвижения объекта смена кадров не успевает зафиксировать незаметное передвижение. Чем больше экран, тем заметнее задержка. Просмотр видео становится некомфортным — устают глаза от необходимости фиксировать неравномерное дерганье картинки. При частоте смены кадров 50 Гц некоторые замечают мерцание картинки.
  2. Герцовка 100—200 единиц — лучшая частота экрана телевизора для покупки. Широкий выбор телеприемников с разным размером экранов предлагается во всех магазинах и выбор сделать легко.
  3. Телевизоры с частотой раскадровки свыше 500 Гц — самые дорогие. Заметных различий неспециалисту между 600 и 200 Гц на глаз заметить не получится. Такие телевизоры часто берут профессионалы для обработки динамических видеоизображений. Компьютерная графика подставляет ряд промежуточных изображений за счет «умного» оборудования.

Телеприемник для прокрутки обычного телевидения не обязан иметь высокие частоты – качество работы ТВ программ еще не столь велико. Специалисты упорствуют, что 120 Гц вполне достаточно. Высокая частота матрицы необходима для просмотра кабельного ТВ, динамических сцен, спортивных соревнований, гонок.

Частота обновления 400 гц. Что на самом деле означает значение гц в телевизоре

В обсуждениях телевизоров 4K постоянно поднимается вопрос о частоте обновления кадров. На то есть весомые причины. С одной стороны, частота обновления кадров напрямую влияет на получение удовольствия от просмотра видео контента, будь то фильмы или спортивные видео трансляции.

С другой стороны, производители телевизоров сами запутывают покупателей специфическим жаргоном, которым они описывают данную функцию в спецификациях. Главная проблема их описаний в том, что это либо откровенный обман, либо неверно технически. В результате даже специалист не всегда может разобраться в их описаниях.

Данная статья написана с целью отбросить все жаргонные словечки и маркетинговую терминологию, чтобы доходчиво объяснить читателю три простые вещи: что такое частота обновления кадров применительно к видео, что такое «естественная» (native) и «улучшенная» (enhanced) частота обновления кадров, и какой эффект оба типа развертки оказывают на качество картинки, которую показывает телевизор.

Все современные премиумные 4K телевизоры, такие как Samsung KS9500, работают с «естественной» (native) частотой развертки в 120 Гц.
Что же такое частота обновления кадров?

На самом фундаментальном уровне частота обновления кадров является тем, что обозначает ее название. Это частота, с которой ваш телевизор обновляет картинку каждую секунду. Чем выше частота обновления, тем более плавную и естественную картинку вы видите на экране. Частота обновления кадров имеет особое значение для динамичного видео высокого разрешения. У каждого видео есть предел, до которого можно увеличивать частоту обновления кадров.

Важно понимать, что телевизор не может добавлять «детализации» к видеоисточнику. Все детали уже находятся внутри видео, а телевизор может лишь обрабатывать сигнал.

Если в качестве примера взять пленку, которую крутят в кинотеатре, то там эквивалентом частоты кадров будут 24 кадра в секунду. Затем эти 24 кадра конвертируются в 30 кадров для телевещания. После этого проводятся некоторые манипуляции с видео и получаются 60 кадров в секунду, которые соответствуют «развертке» в 60 Гц – формате, в котором сегодня выпускается большинство цифрового видео.

4К телевизоры способны работать как в режиме 60 Гц, так и в режиме 120 Гц (60 или 120 картинок в секунду). Старые HD телевизоры работают в основном при 60 Гц (многие модели на самом деле при 50 Гц). Поскольку от 4K телевизоров ожидают высочайшего качества, 60 Гц тут же стали чем-то вроде устаревшей технологии, и сейчас все 4K телевизоры поддерживают частоту развертки равную 120 Гц.

Как связаны частота обновления кадров и количество кадров в секунду видео источника?

И конечно же возникает еще один вопрос: что происходит при просмотре видео 60 Гц на телевизоре со 120 Гц? Телевизор распознает 60 Гц источника и после этого может совершить несколько манипуляций или «улучшений», чтобы показать корректное изображение.

Кадровая интерполяция

Первый метод, который мы рассмотрим, называется кадровой интерполяцией, и эту технологию используют все современные телевизоры, в том числе и 4K телевизоры. Суть данной технологии в том, что берутся два или более разных видео кадра, после чего они накладываются друг на друга и результат данной операции показывается между реальными кадрами. В результате картинка получается немного более смазанной.

Следующий метод называется «вставка черных кадров» (black frame-insertions, BFI). Данная технология заключается в том, что вместо пропущенных кадров вставляются черные кадры. Данный метод позволяет бороться с размытием при движении в кадре (motion blur).

Пример метода BFI.

Что же такое motion blur в 4K телевизорах?

Размытие при движении это проблема видео источника. Оба метода, описанные выше, нужны для того чтобы избежать подобного эффекта при 120 Гц и 60 Гц. Нужно так же понимать, что телевизоры со 120 Гц намного лучше контролируют размытие, чем их 60 Гц аналоги. Размытие, как явление, которое мы воспринимаем своим глазом — это составная честь нескольких факторов. Прежде всего это размытие, свойственное типу матрицы телевизора. Второе, это рассинхронизация развертки и количества кадров в секунду. Третье, это размытие, которое было «зафиксировано» камерой при съемках.

Телевизор не может ничего сделать с размытием, которое возникло при съемках. Интерполяция и BFI нужны для борьбы с первыми двумя причинами возникновения размытия. Оба способа «обманывают» наш мозг так, что мы видим более четкую картинку при просмотре фильма или спортивной трансляции.

Чем лучше 4K телевизор может «подгонять» картинку (24p, 30fps, 60fps) под свои 120 Гц, тем естественней и приятней она будет смотреться. Разумеется, это еще и означает уменьшение дрожания картинки и снижение уровня размытия. Одно из ключевых отличий хорошего 4K телевизора от плохого, в методах обработки картинки с движением в кадре. Чем дешевле телевизор, тем хуже он устраняет вышеперечисленные негативные эффекты.

Отличными примерами телевизоров 4K с разверткой в 120 Гц и хорошим подавлением размытия и дрожания картинки являются телевизоры Samsung 2015 и 2016 годов выпуска, а так же телевизоры LG OLED 4K, которые начали выпускать в этом году.

Как связаны частота обновления кадров и компьютерные игры?

4K телевизоры сегодня очень часто используют в качестве гигантских игровых мониторов и подключают их к компьютерам через HDMI.

Большая часть современных 4K телевизоров отлично работают в роли мониторов, потому что их частоты обновления кадров поддерживают две функции. С одной стороны, все основные брэнды, выпускающие 4K телевизоры в 2015 и 2016 годах, отлично работают при 60 кадрах в секунду, из-за того, что их частота развертки равна 60 Гц. С другой стороны, практически все телевизоры поддерживают 120 Гц, что делает комфортной игру при 120 кадрах в секунду.

Примеры моделей 4K телевизоров, которые отлично подойдут для игр при 60 Гц: Samsung JU7100, LG OLED 4K EF9500, Samsung SUHD KS8000.

4K телевизоры, которые поддерживают Full HD при 120 Гц это Sony X810C и X850C.

Что же значат «улучшения» частоты кадров применительно к 4K телевизорам?

Прежде чем мы продолжим, запомните одну фундаментальную и простую вещь, которая позволит избежать недопонимания в будущем. Частота развертки может быть только 60 Гц или 120 Гц.

Любая, указанная производителем, частота развертки выше 120 Гц является следствием действия более интенсивных версий интерполяции или BFI. Такие «улучшенные» развертки могут достигать 240 Гц. У каждого производителя данная «технология» называется по своему.

Если 4K телевизор предлагает частоту развертки 60 Гц, то «улучшенной» (enhanced) разверткой будут 120 Гц, если обычная развертка телевизора 120 Гц, то «улучшенная» будет 240 Гц. Примеры таких разверток и их названия включены в список, с которым вы можете ознакомиться ниже:

  • Sony: MotionFlow
    • 120 Гц при 60 Гц native refresh и 240 Гц при 120 Гц «родной» (native) развертке
  • Samsung: Motion Rate
  • LG: TruMotion
    • 120 Гц при 60 Гц native и 240 Гц при 120 Гц native
  • Vizio: Effective Refresh Rate
    • 120 Гц при 60 Гц native и 240 Гц при 120 Гц native. Vizio предлагает развертку “Clear Action”, которая удваивает переработанную картинку. В итоге получаются цифры наподобие 480 Гц и 720 Гц для 60 Гц или 960 Гц для 120 Гц. Эти цифры ничего не значат и были придуманы для того, чтобы впечатлить потенциального покупателя.
  • Panasonic: Image Motion
    • 120 Гц при 60 Гц native и 240 Гц при 120 Гц native

Графики, подобные этому, обманывают покупателей и заставляют их думать, что существует развертка выше 240 Гц. На самом деле развертки выше 240 Гц никак не влияют на качество картинки.
Заключение

В большинстве случаев обычной развертки в 120 Гц будет достаточно. Некоторые телевизоры предлагают отличное качество картинки и контроль движения в кадре при 60 Гц. Разница между 60 Гц и 120 Гц будет едва заметна на видео, которое сделано под 60 Гц. Дополнительные технологии улучшения движения в кадре (такие как удвоение частоты обновления) являются хорошим бонусом в специфических ситуациях, например при просмотре спортивных состязаний, где размытие добавляет эффект присутствия. На все технологии, делающие частоту развертки выше 240 Гц, можно смело не обращать внимания.

Подробности Словарь терминов

Время отклика пикселя

Динамическая контрастность

Контрастность

Прогрессивная развертка

Разрешение

Телевизионная развертка

Телевизионный тюнер

Угол обзора

Частота обновления изображения

Чересстрочная развертка

Интерфейс RS-232

Аудио выход (стерео)

Коаксиальный аудио вход и выход

Компонентный видеовход и выход (YPbPr)

Оптический аудио вход и выход

AV-вход и выход

Технология PIP («Картинка в картинке»)

Технология POP («Картинка вне картинки»)

Технология PAP («Картинка и картинка»)

Телетекст

HDCP в DVI-интерфейсе

Технология 3D

Типы LCD-матриц

LED-подсветка

Технология NICAM

Сабвуфер

Стереозвук

Bluetooth

Compact Flash

DivX

Общие характеристики телевизоров

Весь экран приемника разбит на мельчайшие точки (пиксели), совокупность которых и создает на нем цветную картинку. Яркость свечения каждого пикселя LCD-матрицы зависит от напряжения, которое подается на него, меняя в разной степени прозрачность ЖК-ячейки. Временной промежуток, необходимый жидкокристаллической ячейке, чтобы полностью перейти из закрытого состояния в полностью прозрачное, называется временем отклика пикселя.

Если время отклика пикселя превышает определенный порог, то зритель на экране может видеть несколько размытые контуры движущегося объекта, например кометный шлейф, который тянется за летящим в ворота футбольным мячом. Это явление вызвано тем, что рядом стоящие пиксели не всегда успевают быстро перейти в полностью закрытое или открытое положение, поэтому их промежуточное состояние полупрозрачности и вызывает видимые искажения телевизионной картинки.

Время отклика пикселя измеряют в миллисекундах, однако до сих пор не создан единый стандарт определения этой величины, поэтому многие разработчики телевизоров в маркетинговых целях могут указывать в спецификациях величины, способные ввести потребителя в заблуждение. Согласно стандарту TrTf, введенному в обиход компанией VESA и используемому наиболее авторитетными производителями телевизоров и мониторов, оптимальное время отклика пикселя должно быть не более 20 мс.

Динамическая контрастность – одна из характеристик, указывающая на способность экрана телевизора отображать наиболее светлые и темные детали изображения, которая была введена в обиход в большей степени в маркетинговых целях.

Понятие динамической контрастности стали применять после начала использования в LCD-телевизорах технологии изменения яркости подсветки матрицы в зависимости от сюжета и событий, происходящих в кадре. После появления на рынке ЖК-телевизоров с ковровой светодиодной задней подсветкой, позволяющей искусственно затемнять не весь экран, а только его определенные участки, значение динамической контрастности еще более выросло.

Таким образом, наряду с реальной статической контрастностью экрана телевизора стали использовать более внушительно смотрящуюся динамическую контрастность, значение которой искусственно увеличивалось за счет изменения яркости задней подсветки матрицы, которая делала темные участки изображения более черными и наоборот.

Сегодня многие производители указывают в спецификациях своих телевизоров значение динамической контрастности на уровне фантастических величин 1 000 000:1 и даже 5 000 000:1, которые эффектно смотрятся на фоне традиционной статической контрастности, которая обычно не превышает 5 000:1. Следует сказать, что указанный уровень динамической контрастности вряд ли поможет вам оценить реальное качество отображения картинки на экране телевизора.

Контрастность – одна из важнейших характеристик экрана телевизора, выражающая его способность отображать мелкие детали и элементы текстуры изображения.

В физическом смысле контрастность представляет собой соотношение уровней наиболее светлого и наиболее темного участков экрана, которые может отобразить телевизор или монитор. Например, коэффициент контрастности равный 3000:1 говорит о том, что экран телевизора может отображать белый цвет, который будет выглядеть в 3000 раз более ярко, чем полностью черный.

Различают статическую и динамическую контрастности. Статическая контрастность, которую можно считать наиболее объективной характеристикой экрана телевизора, оценивает яркостные отношения между наиболее светлыми и темными участками в пределах одного видеокадра.

Динамическая контрастность экрана является более условным понятием, введенным в обиход маркетологами, позволяющим искусственным образом увеличить показатели статической контрастности за счет изменения уровня задней подсветки в LCD-телевизорах.

Прогрессивная развертка – один из двух распространенных способов формирования изображения на экране телевизионного приемника, при которой картинка образуется путем построчной передачи информации, когда каждая строка изображения последовательно сканируется лучом слева направо и сверху вниз.

К сильным сторонам прогрессивной развертки можно отнести более высокую четкость передачи движущихся объектов, отсутствие эффекта мерцания, утомляющего зрение, а также возможность более качественной и простой работы с изображением (масштабирование, сохранение отдельного кадра и т.п.).

В качестве недостатков прогрессивной развертки можно привести сравнительное удорожание системы за счет двойного увеличения полосы пропускания (ширины канала) телевизионного сигнала.

Разрешение – одна из важнейших характеристик экрана телевизионного приемника, выражающая его способность отображать мелкие детали изображения. Разрешение экрана измеряется в количествах пикселей – мелких элементов, совокупность которых формирует изображение на экране.

Обычно разрешение определяется размерами телевизионного экрана и технологиями, используемыми для создания изображения. При этом разрешение традиционных телевизоров с электронно-лучевыми трубками (ЭЛТ) определяется немного по иному, чем разрешение более современных LCD и плазменных панелей.

Для телевизоров с ЭЛТ обычно указывают не количество пикселей на экране, а число строк, из которых формируется изображение (625 или 525). Изображение на экранах LCD- и PDP-телевизоров формируется реальными пикселями, количество которых зависит от определенного стандарта, используемого производителями. Плазменные панели обычно выпускаются с разрешением экрана 1024 на 720 или 1024 на 768 пикселей. LCD-телевизоры чаще всего имеют разрешение экранов 1366 на 768 или 1920 на 1080 пикселей.

Для удобства различные виды разрешения экранов были объединены в группы, по их соответствию стандартам качества формирования и передачи телевизионных сигналов.

SDTV – телевидение стандартной четкости предполагает использование телевизионных приемников с разрешением экранов 480 и 576 строк (при чересстрочной развертке).

EDTV — телевидение повышенной четкости предполагает использование телевизионных приемников с разрешением экранов 480 и 576 строк (при прогрессивной развертке).

HDTV ( Full HD) — телевидение высокой четкости предполагает использование телевизионных приемников с разрешением экранов 720 и 1080 строк (при прогрессивной развертке), а также только 1080 строк (при чересстрочной развертке).

Чаще всего в спецификациях LCD- и PDP-телевизоров указывают не только количество строк на экране, но и количество отдельных элементов (пикселей) в каждой строке. После числового выражения количества строк обычно указывают тип развертки, используемый в телевизоре (i – чересстрочная, р – прогрессивная). Например, разрешение экрана 1920х1080р указывает на то, что это телевизор использует прогрессивную развертку, а изображение формируется из 1080 строк, каждая из которых состоит из 1920 пикселей.

Телевизионная развертка – последовательное разложение передаваемого изображения на составные части (горизонтальные строки) с целью формирования видеосигнала, а также обратное преобразование этого сигнала в изображение в телевизионном приемнике.

Различные стандарты телевидения предполагают наличие разного числа строк, на которые раскладывается изображение. В системе NTSC предусмотрено 525 строк, а стандарты PAL и SECAM предполагают разложение изображения на 625 строк. Кроме того, телевизионная развертка бывает двух видов: чересстрочная и прогрессивная.

Телевизионный тюнер

Говоря простыми словами, тюнер – это специальное электронное устройство, призванное изменить сигнал (декодировать, синхронизировать, форматировать), поступающий на вход приемника (в нашем случае телевизора), преобразовывая его в понятный для того вид.

Тюнеры бывают внешние и встроенные в телевизор. Ранее, когда телевидение было полностью аналоговым, все телевизионные приемники оснащались встроенными тюнерами. В эру цифрового телевидения, с его обилием разнообразных стандартов вещания, способов сжатия и кодировки телевизионного сигнала, многие крупноэкранные телевизионные приемники не оснащаются встроенными тюнерами, а требуют их дополнительного приобретения.

Сам встроенный тюнер имеет определенные габариты, которые несколько увеличивают размеры модных ныне плоских панелей. Гораздо удобнее его просто спрятать подальше от посторонних глаз. В данном случае телевизор играет просто роль обычного монитора, а выбирая тот или иной внешний тюнер, вы ориентируетесь на необходимый вам формат принимаемого сигнала. Кроме того, чтобы улучшить характеристики приема сигнала вам не потребуется менять саму панель, а просто приобрести новый тюнер или обновить его прошивку.

Все тюнеры делятся на категории, в зависимости от поддерживаемых стандартов телевизионного вещания, принятых в различных регионах мира. В европейской зоне используются цифровые телевизионные тюнеры следующих видов:

  • Тюнеры DVB-C – устройства, позволяющие принимать цифровой сигнал европейского стандарта кабельного телевидения;
  • Тюнеры DVB-S – устройства, позволяющие принимать цифровой сигнал европейского спутникового телевидения;
  • Тюнеры DVB-S2 – устройства, принимающие более совершенный тип сигнала европейского спутникового телевидения второго поколения. Новый стандарт предполагает большую пропускную способность каналов, а также возможность передавать более качественный сигнал;
  • Тюнеры DVB-T – устройства, позволяющие принимать цифровой сигнал европейского наземного эфирного телевидения;
  • Тюнеры DVB-T2 – устройства, способные принимать сигналы второго поколения наземного эфирного цифрового телевидения высокой четкости, обладающего в два раза большей эффективностью, чем стандарт DVB-T.

Даже если ваш телевизор имеет встроенный тюнер для просмотра кабельного и спутникового телевидения, чтобы смотреть определенные каналы с высокой четкостью изображения HDTV, от вас потребуется специальные устройства авторизованного доступа.

Кроме европейских стандартов в мире также используются американские (ATSC), японские (ISDB) и китайские (DMB-T/H) стандарты цифрового телевизионного вещания, также требующие наличия специальных тюнеров.

Угол обзора – показатель, характеризующий способность экрана жидкокристаллического или плазменного телевизора качественно отображать цвета и контрастные детали изображения. Измеряется в угловых градусах. Считается, что для традиционных телевизоров с электронно-лучевой трубкой угол обзора по умолчанию является равным 180 градусам.

Из-за конструктивных особенностей передачи изображения, реализованных в LCD и PDP-телевизорах, самым идеальным углом обзора является 0 градусов, то есть когда зритель находится прямо перед экраном. Во всех иных случаях наблюдаются искажения цветопередачи и контрастности разной степени.

Современные жидкокристаллические и плазменные телевизоры могут иметь углы обзора до 180 градусов, хотя более 130 градусов зрителю вряд ли понадобятся. В спецификациях телевизора производитель обычно указывает две величины предельных углов обзора, которые разделяются между собой косой чертой. Первая цифра обозначает предельный угол обзора экрана в горизонтальной плоскости, а вторая – в вертикальной (последняя может быть актуальной при монтаже телевизионных панелей на высоте).

Частота обновления изображения – важный показатель качества телевизора, который характеризует скорость смены кадров на его экране. Чем выше частота обновления изображения, тем лучше качество отображения динамических сцен на экране телевизора и тем менее заметно его мерцание, утомительное для глаз человека (в моделях с ЭЛТ).

Современный видеоконтент, отличающийся высоким разрешением и обилием динамических сцен, уже не может качественно отображаться на LCD-экранах телевизоров, имеющих традиционную частоту обновления картинки 50 раз в секунду. В данном случае изображение быстро движущихся объектов получалось размытым, оставляющим за собой своеобразный «кометный шлейф», который вызывается определенной инерционностью ЖК-ячеек. Поэтому производители вынуждены были прибегнуть к различным программным ухищрениям, чтобы увеличить частоту обновления кадров на экране, причем каждая компания создавала свои собственные запатентованные технологии.

Наиболее простым способом увеличения частоты обновления является вставка между двумя последовательными кадрами промежуточного, который создается на основе анализа положения объектов на предыдущем и последующем кадрах, а также вычислении направления и скорости их передвижения в дальнейшем. Таким образом, можно легко удвоить частоту обновления изображения на экране телевизора.

Еще более повысить ее частоту можно добавляя не один, а несколько промежуточных кадров, а также используя сложный алгоритм управления сканирующей и мерцающей задней подсветкой LCD-матрицы и локального затемнения экрана, которые позволяют устранить размытость движущихся объектов.

Сегодня производители указывают в спецификациях своих телевизоров совершенно фантастические частоты обновления экранов 800 и даже 1000 Гц. Однако в данном случае речь идет не о реальной частоте обновления изображения, а о маркетинговом параметре, характеризующем комплекс примененных ими технологий для улучшения качества изображения.

Чересстрочная развертка – наиболее распространенный и традиционный способ получения изображения на экране телевизионного приемника, при котором каждый кадр разбивается на два поля (полукадра): сначала выводятся нечетные, а затем четные строки.

Такой способ передачи изображения изначально был разработан для систем раннего аналогового телевидения, так как не выдвигал больших требований к приемо-передающей аппаратуре и был основан на инерционных особенностях человеческого зрения, которое воспринимало последовательный процесс смены изображения как непрерывный.

Слабыми сторонами чересстрочной развертки является «эффект мерцания изображения», который постепенно утомляет зрительный аппарат человека. Особенно заметен этот эффект при демонстрации видеосигнала, сформированного системой с чересстрочной разверткой, на телевизионном приемнике, использующем прогрессивную развертку (большинство современных LCD-телевизоров).

Яркость – величина, которая характеризует отношение силы свечения экрана телевизора к его общей площади. Измеряется в канделах на квадратный метр площади (кд/м²). Современные LCD и PDP-телевизоры имеют показатели яркости в пределах 400-500 кд/м².

Впрочем, сильная яркость экрана будет оправдана при просмотре видеопрограмм в условиях яркого солнечного или искусственного освещения. При полном отсутствии фонового света просмотр видео может быть некомфортным и весьма утомительным для глаз. Обычно настройки телевизора позволяют плавно или ступенчато менять яркость свечения его экрана, соотнося ее уровень с внешними условиями освещенности.

В числе ключевых технических характеристик компьютерных дисплеев и телевизионных мониторов — частота обновления. В каких случаях данный параметр допускается? Когда желательно корректировать вручную? В каких ситуациях данного рода процедура не имеет целесообразности?

Что такое частота экрана?

Монитор компьютера или экран телевизора работает по принципу последовательности кадров. То есть примерно так, как кинопроектор. Частота кадров при воспроизводстве фильма — порядка 25-30. В случае с монитором ПК или экраном телевизора данный показатель должен быть выше, так как выстраиваемая картинка гораздо сложнее, чем видеоряд на пленке. Общее правило — чем больше показатель частоты, тем четче изображение и тем приятнее смотреть на экран.

Частота и тип экрана

Есть несколько технологических типов реализации экранов и мониторов. Самые современные — это ЖК, LCD и LED. Относительно устаревшими считаются CRT. ЖК-телевизора или монитора (по аналогичной технологии) при этом определяется с учетом иных принципов, чем в случае с приборами, в которых установлены электронно-лучевые проекторы. В случае с ЖК-дисплеем картинка прорисовывается на всем пространстве экрана сразу.

Если речь идет о CRT-дисплеях — построчно. Поэтому, если частота обновления экрана ЖК-телевизора и электронно-лучевого агрегата одинакова, то качество с высокой вероятностью будет отличаться в пользу устройства первого типа. Более того, если соответствующий показатель составляет порядка 60 ГЦ (количество обновлений дисплея в секунду), то в случае с CRT-мониторами будет очень заметным мерцание.

Настройка частоты для CRT-дисплеев

Поэтому мы уделим настройке электронно-лучевых дисплеев особое внимание. Как изменить частоту обновления экрана CRT-типа в Windows на примере версии XP? Очень просто. Необходимо войти в Затем выбираем «Экран». Открыв соответствующее окно, необходимо найти закладку «Параметры». Далее — «Дополнительно». Там, скорее всего, будет список из нескольких вариантов.

Какую частоту обновления экрана ставить? Для CRT-мониторов рекомендуемое значение — 85 ГЦ. Если данной цифры нет в списке, то это, скорее всего, связано с тем, что на ПК не установлен заводской драйвер видеокарты. Его необходимо скачать в Интернете или же поискать на дисках, которые прилагались к ПК при продаже. Можно также попробовать обратиться в сервисный центр с просьбой помочь с драйвером.

CRT-дисплеи: нюансы

Отметим, что практически во всех операционных системах есть возможность изменить такой параметр, как частота обновления экрана. Windows 7 как самая современная и, казалось бы, не требующая существенного вмешательства в настройки со стороны пользователя, не исключение. В этой версии ОС алгоритм настройки нужных параметров практически тот же. Через «Панель управления» устанавливается нужная частота обновления экрана. адаптирована к выставлению соответствующих настроек? Практически все версии Windows справляются с задачей одинаково. Правда, что касается самых свежих версий ОС (той же Windows 7), в них могут быть некоторые сложности с драйверами для устаревших устройств. Но они решаемы — как правило, любое ПО соответствующего типа можно найти в Интернете.

Также при работе в Windows 7 алгоритм выхода на нужные настройки несколько отличается от сценария в XP. Нужно войти в «Панель управления», затем нажать на «Экран», после — выбираем изменение его параметров. Затем — «Дополнительные настройки». Далее переходим на вкладку «Монитор», где находим настройки частоты.

Отметим также — при выставлении в Windows всех версий соответствующих параметров не следует снимать галочку около пункта «Скрыть режимы, которые монитор не использует». Дело в том, что технологически экран, конечно, способен работать с настройками вне рекомендованных. Но на практике это может создать проблемы со стабильностью работы ПК. Поэтому, если пользователь задается вопросом, как поменять частоту обновления экрана, если нужного параметра нет, а доступные значения ниже, чем желательные для CRT-экранов, первое, что мы ему порекомендуем — установить самые свежие драйверы на видеокарту.

Фактор разрешения

В некоторых случаях качество изображения на CRT-дисплее зависит от разрешения. При более высоких его значениях на экране помещается попросту больше элементов. А в случае, например, с фотографиями или видео, есть возможность просматривать их более детально. Оптимальные параметры разрешения зависят, прежде всего, от величины экрана в дюймах. Но, в принципе, пользователь может поэкспериментировать с выставлением разных значений. Отметим, что поменять разрешение можно, используя тот же алгоритм, что и при смене частоты экрана — через «Панель управления» и «Экран».

Отметим также, что при слишком большом разрешении выставить 85 ГЦ не всегда получится. И это, кстати, одна из возможных причин, почему нужная цифра может отсутствовать в списке частот. Поэтому, если драйверы стоят самые свежие, а 85 ГЦ не присутствует в списке, можно попробовать немного уменьшить разрешение монитора.

Частота ЖК-дисплеев

Следует отметить, частота обновления картинки на экране ЖК-дисплеев — в большинстве случаев параметр, не имеющий особого значения. Просто потому, что более или менее современные мониторы еще в заводских условиях настроены так, что корректировка частоты попросту не требуется. Даже если она равна 60 ГЦ, что может быть критичным для ЭЛТ-дисплеев, заметного мерцания изображения не будет в силу технологической специфики, о которой мы сказали выше. Вместе с тем, что касается ЖК-дисплеев, — для них более важен другой параметр — скорость обновления пикселей. Во многих случаях его, к слову, отождествляют с «частотой» экрана — даже в среде IT-специалистов. Это, строго говоря, не совсем верно. Хотя бы потому, что скорость обновления пикселей выражается не в герцах, а в другой единице — миллисекундах. Но если данный термин употребить в контексте «частоты», никто, пожалуй, не обвинит нас в недостатке технической грамотности. Поэтому мы, употребляя термин «частота» в отношении ЖК-дисплеев, будем понимать его как «скорость обновления пикселей».

Итак, какова лучшая частота обновления экрана в ЖК-мониторах? Самое главное — обеспечить оптимальное соответствие данного параметра потоку кадров, генерируемому видеокартой компьютера. То есть если, например, эта микросхема будет выдавать картинку с частотой в 60 герц, а ЖК-монитор не будет обладать достаточной скоростью обновления пикселей (таковым можно считать показатель примерно в 30-40 миллисекунд), то изображение на экране будет казаться «плывущим». Чем меньше соответствующий параметр на дисплее, тем лучше. Идеально, если он не превышает 15 миллисекунд. Как правило, вопрос, как увеличить частоту обновления экрана ЖК-типа, не стоит. В свою очередь, скорость обновления пикселей — параметр в большинстве случаев заводской. Изменить его в домашних условиях проблематично. Поэтому стоит обращать внимание на него непосредственно при покупке экрана.

Технологический аспект

Практически аналогичные закономерности характерны также и для других цифровых устройств, в которых используется ЖК-дисплей. То есть, например, частота обновления экрана ноутбука — параметр столь же «закрытый» для корректировки, как и в случае с мониторами для ПК.

Возможная разница в качестве изображения на в крайне редких случаях зависит от выставленных значений частоты. Практически всегда ключевой фактор — это уровень технологий, предопределяющих, главным образом, скорость обновления пикселей. Менее важно, какая установлена частота обновления экрана. Какая лучше технология построения картинки с точки зрения «пикселизации» и цветопередачи для конкретной модели монитора — определяет в первую очередь бренд-производитель. Экраны устаревших типов, конечно, могут «выдавать» не вполне качественное изображение. Но что касается современных изделий, существенных проблем с ними, как правило, не возникает. Также отметим, что кроме «частотного» фактора, на качество картинки влияет большое количество других параметров, характерных для экранов ПК и ноутбуков. Это разрешение, характеристики видеокарты.

Частота экрана ЖК-телевизоров

Каковы особенности функционирования дисплеев на ЖК-телевизорах? Что касается ключевых закономерностей — они, в принципе, те же, что на компьютерных экранах. То есть на большинстве современных телевизионных дисплеев частота обновления достаточна, чтобы изображение не «прыгало». Что касается скорости обновления пикселя — как правило, бренды-производители телевизоров стараются оптимизировать все под характеристики экрана. Поэтому особых проблем, связанных с «плавающей» картинкой, на современных ТВ не наблюдается.

Вместе с тем, частота обновления экрана телевизора — параметр, характеризующийся рядом особенностей. Каких, например? Вновь отметим некоторую двойственность употребления технических терминов. Дело в том, что есть как таковая частота обновления экранной картинки — в отношении нее работают те же принципы, что и для соответствующих типов компьютерных мониторов. Есть, в свою очередь, другой параметр, кадровая частота видеоряда, который характерен именно для телевизоров.

Касательно второй характеристики — можно провести прямую аналогию с кинопленкой. Этот параметр характеризует, сколько кадров в секунду проходит через пространство экрана. В большинстве современных ЖК-телевизоров он составляет 50 ГЦ. Очевидно, этого более чем достаточно для производства фильмов — там частота кадров, как мы уже сказали выше, как правило, в пределах 30 единиц за секунду.

Таким образом, частота обновления экрана телевизора — параметр важный, но, как и в случае с компьютерами, дополнительной корректировки, как правило, не требующий, и не подлежащий ей по умолчанию. Аналогично — с кадровой частотой видеоряда. Данный параметр — также типично заводской.

ТВ: характеристики матрицы

Можно также отметить, что технические характеристики ТВ включают ряд дополнительных параметров. Таких как, например, время отклика матрицы. Как работают ЖК-дисплеи? На кристалл, являющийся «зерном» общей картинки на дисплее, попадает электрический импульс, вследствие чего пиксель светится. Однако в силу технологических особенностей гаснет он не сразу. И потому на экране, даже после того, как на него выведен новый кадр, может на доли секунд оставаться еще не успевшая исчезнуть предыдущая картинка. Вследствие этого изображение, подобно тому, как это происходит на экранах ПК, может казаться «плавающим». Но стоит отметить — современные модели ЖК-телевизоров, как правило, снабжены аппаратными компонентами, способными корректировать такое поведение дисплея. К тому же отклик матрицы на ТВ-экранах, которые сейчас выпускаются, как правило, минимален. То есть и в случае с ЖК-телевизорами вопрос, как увеличить частоту обновления экрана, практически не стоит. Собственно, возможности для корректировки соответствующего параметра у владельцев ТВ в большинстве случаев отсутствуют.

Частота дисплеев ПК и ТВ: выводы

Итак, мы узнали, что такое частота обновления экрана, какая лучше для CRT-мониторов, в которых соответствующий параметр в ряде случаев требует ручной корректировки в настройках Windows. Какие выводы касательно изученных особенностей дисплеев разных типов мы можем сделать?

Эквивалентная частота обновления экрана в CRT-мониторе и ЖК практически ничего не значит с точки зрения сравнения качества изображения. Хотя бы потому, что принципы построения картинки в каждом случае разные. Вторая причина — на жидкокристаллических дисплеях частота — скорее, второстепенный фактор качества изображения. Более важен другой параметр — скорость обновления пикселей.

Качество картинки, как в случае с ЖК-экранами компьютеров, так и относительно CRT-дисплеев, во многом определяется характеристиками видеокарты. При этом часто бывает так, что соответствующего типа микросхема технологически отстает от монитора. То есть, например, дисплей имеет минимальный показатель скорости обновления пикселей, а видеокарта не может задействовать данный ресурс в полной мере. На практике это может выражаться в том, что при запуске компьютерных игр с высокой частотой видеоряда какие-то элементы картинки будут прорисовываться не вполне четко. Хотя, опять же, отметим — подобного рода проблемы достаточно редко встречаются сегодня. Что же касается фильмов, объективных причин того, чтобы качество видеоряда при их воспроизводстве зависело от частоты (и в большинстве случаев — скорости обновления пикселей), быть не может, просто потому, что фильмы — это, как правило, видеопоток до 30 кадров. Аналогично — с ЖК-телевизорами, особенно в современных модификациях. В них установлена оптимальная частота обновления экрана. Какая лучше модель справляется с оптимальным воспроизводством видеоряда — вопрос, при ответе на который правомерно обращать внимание, прежде всего, на уровень технологий, применяемых брендом. Частота — аспект в данном случае второстепенный.

При выборе телевизора покупатель может увидеть в описании выбранной модели такую характеристику, как PQI. Что она означает и каким должно быть ее оптимальное значение? Сейчас попробуем во всем разобраться.

Picture Quality Index (PQI) – это индекс качества изображения придуманный маркетологами Самсунг для удобства выбора телевизора. Он может иметь разное значение, которое находится в широком диапазоне. Считается, что чем выше будет этот показатель, тем лучше и контрастней окажется изображение во время быстрого передвижения объектов на экране телевизора. Например, в телевизорах торговой марки Samsung представлены модели 7 серии со значением Picture Quality Index на уровне 1400. Благодаря этому показателю потенциальный покупатель сможет при выборе техники сравнить качество изображения нескольких телевизоров между собой.

Какие показатели берутся во внимание?

При расчете PQI учитывается действие современных технологий в области отображения цвета и деталей, глубины изображения и контрастности. Этот показатель пришел на замену индексу CMR — герцовка изображения (Clear Motion Rate), который производитель указывал до 2015 года. Clear Motion Rate (CMR) имел значение в диапазоне 200 — 400 — 600 -600 или 1200 гц. В 2016 году специалисты компании Samsung решили придумать свой показатель качества картинки, разработав значение PQI.

Значение PQI в моделях 9 серии

В моделях 9 серии PQI может иметь значение от 100 до 2400 единиц. Однако далеко не во всех странах компания Samsung декларирует этот индекс. К примеру, на территории США вместо PQI производитель использует значение MOTION RATE. Этот показатель указывает количество кадров в секунду, демонстрируемых на экране (Для телевизоров без 3D = 100 — 200 Гц. Телевизоры с 3D от 200 Гц) Такой подход связан с требованиями местного законодательства предоставлять потенциальным покупателям полную информацию, которая касается качества техники.

Рассмотрим что такое индекс динамичных сцен и как он технически работает на телевизоре. Данное описание подходит для индексов динамичных сцен любого производителя.

Производители телевизоров патентуют собственные названия индекса:

Clear motion rate (CMR), Picture Quality Index (PQI) в TV Samsung

Picture Mastering Index (PMI) в TV LG

Perfect Motion Rate (PMR) в TV Philips

Motionflow XR в TV Sony

Active Motion & Resolution(AMR) в TV Toshiba

Backlight scanning BLS-cканирующая подсветка в TV Panasonic

Clear Motion Index (CMI) в TV Thomson

Subfield Motion в plazma Samsung

Эти технологии оценивает качество показа динамичных сцен, чем выше индекс тем более естественную картинку должен показать телевизор. Но телевизор изначально может показать не более 240 кадров в секунду больше не позволяют технические характеристики матриц экранов. Да и стандарты записи видео оговаривают, что максимально устройства видеозаписи могут записать видео с частотой не более 60 кадров в секунду.

Стандартное изображение на большинстве моделях телевизоров имеет частоту обновления 60 раз в секунду. Данная величина способна обеспечить достаточно четкое, контрастное и яркое изображение происходящего на экране. А в новейших телевизорах, которые поддерживают Ultra HD разрешение, картинки отличаются еще более насыщенными цветами. К этому стоит добавить, что на экране кинотеатра изображение сменяется со скоростью 24-25 раз в секунду. Отсюда вопрос – тогда зачем нужна еще большая частота кадров, если и так все хорошо видно? Ответ на этот вопрос заключается в некоторых фактах, которые и представят все преимущества данного параметра.

Рассмотрим характеристики динамичного, быстро изменяющегося изображения, транслирующегося по стандартному жидкокристаллическому экрану телевизора. Можно вспомнить канал о животных, на котором гепард стремительно преследует антилопу или всевозможные опыты из популярных программ канала Дискавери. Оказывается, что для качественного просмотра всех движений, происходящих в передачах, будет недостаточно 60 Гц, являющихся стандартным параметром для большей части телевизоров. Особенно это может быть заметно в спортивных передачах: безусловно, вратарь, отбивающий летящую шайбу, будет различим на поле, а вот сама шайба может быть и незаметной. И такая ситуация характерна для экранов с низкой частотой. Именно из-за низкой частоты кадровой развертки динамические объекты выглядят размытыми, теряют резкость и за ними становится трудно наблюдать. Они могут отображаться и по-другому – дискретно. В данном случает это будут резкие, оторванные друг от друга движения, которые как бы оторваны друг от друга. Такой вариант также не способствует качественной оценке изображения.

Отсюда вопрос – можно ли каким-либо способом изменить ситуацию и сделать изображение максимально реалистичным? Конечно, это возможно осуществить при помощи увеличения частоты смены кадров. Именно этот параметр позволит усилить четкость и контрастность предметов, находящихся в движении.

У кого-то возникнет вопрос: «Откуда берутся недостающие кадры, которые превращают несколько разреженных кадров в единое целое плавное движение? Известно, что источник видеосигнала не занимается их передачей». Ответ может кого-то удивить, но он звучит так: недостающие кадры приходится «выдумывать». И занимается этой деятельностью специальный чип – «криэйтор» — видеопроцессор. Он отвечает за создание новых кадров и вставкой их между уже существующими, промежуточными. Кроме этой функции, видеопроцессор успевает заниматься и другими, не менее полезными делами: шумоподавлением, коррекцией цветопередачи, увеличением резкости изображения.

Копнём глубже и рассмотрим с какой реальной частотой может работать современный LED телевизор.
Как правило, в телевизорах применяется матрица изготовленная по IPS технологии или её модификация, матрицы по этой технологии обеспечивают хорошую цветопередачу порядка 99% и углы обзора 178° как по вертикали, так и горизонтали что не мало важно для просмотра телевизора, ведь не всегда телезритель сидит прямо перед телевизором.

Проведя несложные вычисления можно определить следующее: отклик матрицы IPS порядка 5 мс, следовательно 1000/5=200 кадров в секунду. Стандартная матрица телевизора может показывать в секунду около 200 кадров, но это в идеале, на практике время отклика может быть и больше, например 7 миллисекунд.

Производители устанавливают в телевизоры матрицы 3 типов

Матрицы которые могут показать 60 кадров в секунду

Матрицы которые могут показать 120 кадров секунду (наиболее распространённые типы матриц)

Матрицы которые показывают 240 кадров в секунду (как правило устанавливаются в дорогих моделях)

Какая частота кадров в различных стандартах (надо представлять для последующего понимания принципа работы).

1080i: чересстрочный стандарт с кадровой частотой 25, (29,97) или 30 кадров в секунду

1080p: стандарт с прогрессивной развёрткой допускающий использование кадровых частот 24, 25, 30, 50 или 60кадров в секунду

720p: стандарт с прогрессивной (построчной) развёрткой, допускающий использование кадровых частот 50 или60 кадров в секунду

SD: стандартное цифровое телевидение 50 или 60 кадров в секунду.

Аналоговый сигнал: 25 кадров в секунду.

Телевизор не имеющий индекса динамичных сцен

В таком телевизоре показывается изображение с той частотой кадров, с которой он принимает сигнал, в телевизоре не производится никакой коррекции или улучшения сигнала. Как правило ведущие производители телевизионной техники уже не выпускают телевизоры без индекса динамичных сцен.

Индекс динамичных сцен 100

В телевизорах имеющих индекс динамичных сцен 100 улучшение изображения происходит за счёт добавления 1 кадра между существующими двумя. Как правило идентичного существующему. Если в телевизоре применена 60 Гц матрица, то улучшение изображения можно увидеть только при просмотре изображения с частотой кадров менее 60. Если показывается изображение с частой 60 кадров технически не возможно его уже улучшить.

Индекс динамичных сцен 200

В основном та же суть, что и при индексе 100 меняется только сам алгоритм обработки изображения процессором .

Индекс динамичных сцен 400-600

В телевизорах с индексом динамичных сцен 400-600 добавляется между существующими кадрами уже 2-3 кадра, и применяется матрица поддерживающая частоту 120 Гц. Какие создаются промежуточные кадры между реальными, идентичные или вновь созданные зависит от алгоритма работы процессора, но учитывая то, что в телевизорах с индексом динамичных сцен что 100, что 400 применяются одинаковые процессоры, то можно предположить что создаются одинаковые повторяющиеся кадры. Также при таких индексах обязательно применяется локальное затемнение.

Теоретически возможно уже улучшить даже изображение высокой чёткости, хотя на практике по отзывах пользователей этого не заметно.

Индекс динамичных сцен 800-1200

В телевизорах с такими индексами динамичных сцен применяются уже матрицы повыше классом способные показывать более 120 кадров в секунду, а также устанавливаются более быстродействующие процессоры позволяющие, проводя анализ кадра, создавать промежуточные кадры не только идентичные, но и создавать индивидуальные промежуточные анализируя реальные кадры.

По отзывам владельцев телевизоров с различными индексами складывается следующая картина, разница действительно наблюдается по качеству отображения динамических сцен в телевизорах, например, с индексом 100 и 200, но уже свыше 400 или 600 разница незаметна и это можно уже отнести к маркетинговым уловкам производителей.

К тому же, телевизор не всегда правильно может произвести конвертацию или создание промежуточных кадров и иногда улучшенное изображение может быть по качеству хуже изначального. На картинке показать предмет в движении и сказать, что создаются несколько новых промежуточных это одно и совсем другое создать реальный, очень часто при создании промежуточных кадров создаются так называемые цифровые артефакты.

На сегодняшний день ведущие мировые компании по производству электронной техники используют частоту кадров в секунду, равную 200. Это фирмы Samsung, LG и Sony. Как они достигают такой мощной величины? Для того, чтобы телевизор выдавал настоящие 200 кадров в секунду, видеопроцессоры (как правило, в количестве двух штук) между последовательными кадрами стандартного видеопотока в 50 Гц вставляют еще три промежуточных изображения.

В результате новой высокотехнологичной процедуры динамические сцены обрели совершенно новое видение. Технология 200 Гц позволит в мельчайших деталях рассмотреть сложный маневр футболиста или стремительный удар боксера. Теперь любой спортивный матч по телевизору – это настоящий праздник, создающий полное ощущение присутствия на стадионе или в спортзале. Следует заметить, что фаворитами новой технологии являются не только спортивные телепередачи, но и все фильмы, подразумевающие стремительность и скорость. Игроманы, имеющие телевизор с частотой обновления 200 Гц, также будут счастливы от реалистичности того мира, в который играют.

Однако не все производители такие честные и пошли по пути честной развертки в 200 Гц. Кое-кто предпочел «обходной» маневр, предлагая нечто отличное от 200-герцовой развертки, но именуемое именно этим термином.

Как было сказано выше, честный производитель использует следующую схему улучшения качества динамического изображения: метод интерполяции данных MEMC, основанный на создании дополнительных кадров. Другие же изготовители, прикрывающиеся громкой величиной частоты обновления кадров своих экранов в 200 Гц, используют другой метод, ничего общего с увеличением частоты кадров не имеющий. Они применяют технологию гашения задней подсветки (Scanning Backlight — так называемая технология сканирующей подсветки). Использование этой технологии объясняется ее способностью устранять эффект размытости динамичного изображения.

Что же касается частоты, то у телевизора, имеющего псевдо-200 Гц режим, и работающего по технологии Scanning Backlight, реальная частота обновления кадра равна 100 Гц. Экран при этом делится на три части горизонтали, в которых задняя подсветка включается и выключается. Для того, чтобы изображение с частотой обновления в 100 Гц смотрелось как изображение с оригинальной частотой обновления в 200 Гц, к картинке на экране просто добавляется «бегущий» с частотой 100 раз в секунду темный прямоугольник. Кончено, данная инновация ничего общего с подлинной частотой кадров в 200 Гц не имеет. Естественно, что эта технология значительно дешевле первой, рассмотренной выше.

Сторонники метода, базирующемся на затемнении подсветки экрана, утверждают, что черные вставки помогают минимизировать эффект размытости объекта, который находится в движении, делая контуры более четкими в промежуточных кадрах. Также гашение лампы позволяет немного снизить расход электроэнергии.

Но поклонники именно этого метода сглаживания изображения не говорят о его недостатках. А они есть, и немалые. Во-первых, плавность динамичных сцен не становится большей, так как зритель видит такие еже 100 реальных кадров в секунду, как и без этой технологии. Во-вторых, гашение ламп снижает общую яркость изображения. А в-третьих, Scanning Backlight выводит на экраны телевизоров мерцание и размытость, заставляя нас мысленно возвращаться в то время, когда кинескопные телевизоры правили бал.

Таким образом, пополнение видеоряда промежуточным кадром видимо улучшает восприятие всего происходящего на экране. В большей степени это качается сцен, в которых ведущие «роли» играют быстро движущиеся предметы или персонажи. Привлекательности этой технологии добавляет возможность регулировки степени обработки промежуточных изображений, которая может использоваться практически всеми: и любителями спорта, и ценителями фильмов, и искушенными геймерами. Но все эти достоинства в полной степени раскрываются и реализуются только в телевизорах с настоящей 200-герцовой частотой смены кадров а это как правило телевизоры PREMIUM сегмента.

Динамическое сшивание сцен на основе модели Visual Cognition

Динамическое сшивание сцен по-прежнему представляет собой серьезную проблему в поддержании глобальной ключевой информации без потери или деформации, если в системе получения изображений существуют множественные помехи движения. Зажимы объектов, размытость изображения или другие синтетические дефекты легко появляются на конечном вышитом изображении. В своей исследовательской работе мы исходим из визуального когнитивного механизма человека и строим когнитивную модель на основе гибридной значимости, чтобы автоматически управлять сшивкой объема видео.Модель состоит из трех элементов различных визуальных стимулов, а именно интенсивности, контура края и яркости глубины сцены. В сочетании с основанной на многообразии фреймворком мозаики динамическое сшивание сцен формулируется как задача оптимизации пути разреза в построенном пространственно-временном графе. Функция энергии резания для выбора ширины столбца определяется в соответствии с предложенной моделью визуального познания. Оптимальный путь обрезки может минимизировать когнитивную разницу во всем объеме видео.Результаты экспериментов показывают, что он может эффективно избежать синтетических дефектов, вызванных различными интерференциями движения, и суммировать ключевое содержание сцены без потерь. Предлагаемый метод полностью раскрывает роль зрительного когнитивного механизма сшивания человека. Это имеет большое практическое значение для наблюдения за окружающей средой и других приложений.

1. Введение

Широкое поле зрения (FOV) требуется во многих областях применения, таких как интеллектуальный транспорт, военная оборона и гражданская безопасность.Более широкий объем информации об изображении полезен для повышения надежности и безопасности системы. Однако поле зрения обычной камеры обычно намного меньше, чем у человека, из-за ограничений процесса изготовления, связанных с увеличением размера сенсора. Технология сшивания изображений обеспечивает эффективное решение для преодоления ограничения поля обзора камеры, которое привлекает все больше и больше внимания исследователей. Он предназначен для выравнивания последовательности перекрывающихся изображений и смешивания перекрывающихся областей для формирования бесшовного изображения с широким полем обзора.В настоящее время методы можно разделить на два основных направления: одно представлено Шелиски, предложившим классическую модель сшивания, основанную на геометрических соотношениях движений камеры [1], а другое представлено Пелегом и др. который предложил улучшенную модель мозаики адаптивного многообразия [2]. Первый заключается в извлечении геометрического преобразования между частично перекрывающимися соседними изображениями для совмещения и слияния изображений [3–5]. Эта модель считается основой исследования совмещения изображений и сшивания, обработки множества движений камеры, то есть смещения, вращения, аффинного, проективного движения и т. Д.Последний заключается в вырезании узких полос, перпендикулярных оптическому потоку, из изображений с большим перекрытием и вставке их искривленных полос, оптические потоки которых становятся параллельны направлению движения камеры, чтобы адаптивно формировать мозаику выходного коллектора. Такая сшивающая модель преодолевает ограничения движений камеры и способствует развитию сшивания изображений, становясь новым направлением исследований [6–9].

Обе вышеупомянутые категории алгоритмов сшивания изображений обращаются к процессам регистрации и смешивания на пиксельных уровнях, игнорируя механизм визуального восприятия людей и отношения между содержимым изображения.Иногда алгоритмы не могут гарантировать целостность интересного содержимого, особенно когда платформа захвата камеры движется, а отсканированная сцена содержит многомерные движущиеся объекты. Некоторые потенциальные дефекты сшивания, например обрезание объекта, размытие движения или ореолы, вызванные движущимися объектами и движением сцены, а также параллаксом, легко проявляются в окончательном мозаичном изображении. Такая динамическая сшивка сцен по-прежнему представляет собой практическую проблему.

Изображение — это разновидность неструктурной информации восприятия.По сравнению с прямыми операциями с пикселями, как взаимодействовать с когнитивным механизмом человека и относительными математическими моделями для построения новых вычислительных моделей и методов обработки изображений — значимая и необходимая работа. Это полезно для повышения эффективности процесса и дальнейшего всестороннего понимания, если максимально учитывать направляющую роль зрительного когнитивного механизма. В этой статье мы обращаемся к динамическому сшиванию сцены с точки зрения визуального познания, и предлагается эффективный подход к сшиванию, основанный на модели визуального познания на основе гибридной значимости для динамической видеопоследовательности, чтобы избежать синтетических дефектов, вызванных различными движениями сцены. .В первую очередь он рассматривает механизм визуального восприятия человека. И предлагается модель познания, состоящая из нескольких визуальных стимулов, то есть интенсивности, контура края и выраженности глубины сцены входных кадров. Более того, в рамках структуры мозаики многообразия процесс сшивания формулируется как задача оптимизации пути разреза в построенном пространственно-временном графе из исходного входного объема видео. Предлагаемая когнитивная модель ограничивает функцию энергии резания для выбора ширины столбца во время синтеза коллектора.Эффективность идеи внедрения зрительного когнитивного механизма в процесс сшивки изображений подтверждается экспериментами. Ключевое существенное содержимое сцены с широким полем обзора можно суммировать без потери или деформации. Алгоритм способствует дальнейшему анализу глобальных ситуаций в широком поле зрения, а также может служить конкретным ориентиром и источником вдохновения для решения других проблем обработки изображений, в том числе за счет визуального познания.

Работа организована следующим образом.Раздел 2 формулирует нашу проблему сшивания динамических сцен в математическом описании. В разделе 3 рассматривается модель визуального познания на основе гибридной значимости и детали ее расчета. В разделе 4 представлены решения для выходного коллектора с помощью построения графа и оптимизации траектории разреза с минимальными затратами на когнитивную резку. Раздел 5 показывает сравнения и экспериментальные результаты, подтверждающие эффективность предложенного метода. Наконец, мы завершаем эту статью в Разделе 6.

2. Постановка задачи

Мы предполагаем, что исходные динамические сцены захватываются камерой, установленной на горизонтальном устойчивом блоке панорамирования, который может двигаться плавно, и сканировать сцену с помощью определенное полувращение, как показано на рисунке 1.Видеокадры динамических сцен сильно перекрываются в основном направлении сканирования и редко смещаются по вертикали. Поскольку алгоритм мозаики многообразия является эффективным решением для преодоления ограничения движений камеры, мы сшиваем динамическую сцену в этом фреймворке. Суть техники мозаики на основе многообразия состоит в том, чтобы вырезать и вставить соответствующие полосы, аналогичные «линии сканирования» в одномерном линейном изображении камеры, в адаптивное множество выходных мозаик. Полосы от каждого входного кадра должны быть перпендикулярны оптическому потоку и пропорциональны движению камеры [2].


Согласно схеме многослойной мозаики и вдохновленной [7, 8], идея избежать обрезки движущихся объектов или других областей для динамического сшивания сцены заключается в выборе столбцов разной ширины в каждом кадре для формирования полос и их плавного выравнивания. в адаптивное нелинейное многообразие. Процесс можно резюмировать, как показано на рисунке 2. Выровненные соседние полосы должны локально выглядеть как реальная сцена без каких-либо визуальных артефактов.


Определение 1. Учитывая набор пространственно-временных объемов, где представляет th столбец th кадра, выходное изображение сшивки имеет столбцы всего, то есть. Отображение между выходным столбцом и входным столбцом изображения — это вектор, в котором смещение вертикального движения; если основное направление движения камеры горизонтальное, то. Набор определяется как отрезка, полос колонны по времени.
Согласно вышеприведенной гипотезе, каждая траектория разреза соответствует выходному сшивному изображению; поэтому процесс динамического сшивания сцены сводится к поиску и оптимизации отношений отображения между выходными столбцами и входными столбцами.Затем мы можем сформулировать задачу как выбор траектории реза с минимальными затратами на резку во всех пространственно-временных объемах.

Определение 2. Если и, то есть th и th столбцы выходного коллектора являются и, то есть, th столбец th входного кадра и th столбец th входного кадра, соответственно, то Стоимость резки определяется следующим образом:

Стоимость указывает на плавность перехода между последовательными полосами столбцов.Если достаточно мало, это означает, что внешний вид этих двух соседних столбцов и выходного коллектора такой же, как и у столбцов и, входного кадра, или как у столбцов и, -й входной кадр, сохраняя локальную согласованность исходных входных кадров. В этой статье предлагается модель визуального познания, основанная на гибридной значимости, и рассчитываются затраты на когнитивное сокращение, в частности, в соответствии с этой моделью. Более подробные сведения о вычислениях представлены в следующем разделе.

3. Вычислительная модель визуального познания на основе гибридной значимости

Механизм зрительного внимания играет важную роль в зрительном познании [10]. Как использовать этот механизм и относительные математические представления для создания вычислительной модели для визуального познания и руководства по обработке изображений для повышения производительности алгоритмов — это значимая исследовательская работа. В этой статье мы предлагаем модель визуального познания, максимально учитывая потенциальные директивные эффекты, и применяем ее к динамическому сшиванию сцен для повышения качества выходной мозаики.

Недавнее исследование визуальной психологии показывает, что внимание человека может быть вызвано непосредственно визуальным стимулом или задачей наблюдения, направленной на поиск определенных областей, соответствующих этой задаче. Основываясь на этих двух типах причин, паттерны визуального внимания можно разделить на две категории: восходящий паттерн, управляемый стимулом, и нисходящий паттерн, управляемый задачей [11]. При наиболее общем сшивании динамических сцен часто встречается множество различных видов содержимого изображения, например движущиеся автомобили, люди или животные, искусственные здания и природный ландшафт.Трудно определить единую задачу для руководства сшиванием. Таким образом, предлагаемая модель визуального познания использует восходящий способ создания вычислительной модели. Поскольку интересные объекты обычно лежат в областях, наиболее важных с точки зрения зрительного восприятия человека, модель создается на основе множества визуальных стимулов путем формирования гибридных карт значимости движущихся целей и других интересных областей. Модель визуального познания в основном включает три элемента различных стимулов, определяемых следующим образом: где, и — интенсивность, контур края и информация о глубине сцены изображения, соответственно, и,, — весовые коэффициенты различных стимулов.Эти элементы отражают яркость изображения в разных аспектах. Интенсивность — это основное представление изображения. Контур края — еще один важный стимул содержания изображения для анализа. А использование информации о глубине для различения фона и объектов является фундаментальной функцией биологического зрения [12]. Веса композиции можно оценить с помощью метода глобального усиления, основанного на содержании [13]. Благодаря модели визуального познания, общая стоимость резки оптимального выпускного коллектора вдоль траектории резки становится равной. где указывает значимость различий между соседними столбцами, и томов гибридной визуальной когнитивной карты.Стоимость показывает плавность перехода между последовательными полосами столбцов по интенсивности, контуру и выступающей области. Гибридные различия значимости в различных аспектах визуального познания рассчитываются следующим образом.

3.1. Интенсивность Когнитивная значимость Разница

Интенсивность считается примитивной характеристикой психологического и биологического визуального познания [14], которую относительно легко вычислить. Мы описываем интенсивность входных изображений непосредственно их значениями серого или цвета.Разница в интенсивности между последовательными столбцами и входных объемов вычисляется следующим образом: где и — серые значения th и th столбцов в th и th кадрах соответственно. Сведение к минимуму этой разницы позволит сохранить основную информацию о внешнем виде соседних полос. Это основная предпосылка для обеспечения плавного перехода.

3.2. Разница в когнитивной яркости контура края

Помимо характеристики яркости, геометрическая структура контура также является важным фактором, влияющим на непрерывность полос мозаики.Выделение контурных структур может быть выявлено с помощью детекторов границ, например, Sobel, Canny и т. Д., Которые легко вычислить и имеют определенный физический смысл. Тем не менее, результаты обнаружения обычно зависят от степени изменения яркости и контрастности. Мы предлагаем извлекать фазовую конгруэнтность (PC), которая отражает поведение в частотной области, чтобы выразить заметность контурной структуры изображения. На основе множества физиологических и психофизических данных [15, 16] показано, что теория ПК может предоставить биологически правдоподобную модель того, как зрительные системы человека обнаруживают и идентифицируют особенности изображения.По сравнению с краевыми детекторами на основе градиента, он не только инвариантен к освещению и контрасту, но также превосходит в обнаружении и идентификации нескольких выступов краев, включая край ската, край ступеньки, край крыши и край линии. Его можно рассматривать как безразмерную меру значимости локальной структуры. Это свойство гарантирует, что разница в выраженности контуров на основе ПК отражает стоимость структурной непрерывности между последовательными полосами, соответствующими поведению визуального познания. Следовательно, разница когнитивной значимости краевого контура между соседними столбцами и входных объемов определяется следующим образом: где и — значения фазового согласования th и th столбцов на th и th картах ПК, соответственно.

Объем карты ПК может быть рассчитан из входного пространственно-временного объема. Вместо того, чтобы определять заметность краевых элементов непосредственно в точках с резкими изменениями интенсивности, модель ПК постулирует, что особенности воспринимаются в точках, где компоненты Фурье максимальны по фазе в соответствии с психофизическими эффектами на зрительное восприятие человека. Он выводится из модели локальной энергии [17], измерения характерной особенности в частотной области, и первоначально выражается следующим образом: где — амплитуда составляющих Фурье в точке сигнала, а — локальная энергия.Суть ПК заключается в измерении фазового подобия между всеми компонентами Фурье. Он оценивается от 1 до 0, что соответствует значимости признаков от значимых до нулевых. Однако эта мера ПК не обеспечивает хорошей локализации и также чувствительна к шуму. Мы применяем для вычислений усовершенствованный ПК, основанный на банках вейвлетов Лог-Габора и квадратурных парах фильтров, разработанный Ковеси [18] и широко используемый в литературе. Поскольку локальная фаза, полученная с помощью вейвлетов Лог-Габора, не имеет вращательной инвариантности, требуются выборки ориентации, чтобы гарантировать, что характерные особенности обрабатываются одинаково при всех возможных ориентациях.Фазовое соответствие в позиции становится Символы обозначают, что заключенное в него количество равно самому себе, когда его значение положительно, и нулю в противном случае. — небольшая константа, чтобы избежать деления на ноль. — весовой коэффициент для частотного разброса по ориентации. — шумовой порог, предполагаемое шумовое влияние. В результате учитываются только превышенные значения энергии. — местная амплитуда частотной составляющей по шкале и ориентации. — функция вывода фазы, которую можно разложить следующим образом: где — местный средний фазовый угол в ориентации.Произведение и можно рассчитать следующим образом: куда , . Локальная энергия определяется следующим образом: где и — результаты свертки входного сигнала изображения с четно- и нечетно-симметричными фильтрами Лог-Габора, а также по масштабу и ориентации.

3.3. Разница в когнитивной значимости сцены и глубины

Глубина — важный компонентный канал организмов с биологическим зрением. Это помогает сосредоточить внимание на важных местах и ​​объектах просматриваемой сцены.Поскольку человеческая зрительная система развивалась преимущественно в естественной трехмерной среде, она инстинктивно использует информацию о глубине для выполнения визуальных задач. Было предпринято несколько попыток включить глубинный канал в модели вычислительного внимания, чтобы сделать искусственное зрительное внимание биологически правдоподобным [12, 19, 20]. В этой статье мы воспользуемся преимуществом того свойства, что информация о глубине оказывает заметное влияние на выделение региональных объектов, чтобы определить различие когнитивной значимости на основе глубины сцены между соседними выходными столбцами, а также следующим образом: где и — оценочные значения глубины th и th столбцов на картах меток глубины th и th соответственно.Разница в глубине выраженности отражает региональную однородность визуального познания.

Вычисление глубины для системы внимания обычно решается в задачах стереозрения. В общем, воспринимая одну и ту же сцену с разных точек обзора, информация о глубине может быть получена путем вычисления несоответствия, то есть параллакса, между соответствующими парами пикселей на основе принципа триангуляции [21]. Взаимосвязь между глубиной и несоответствием можно кратко объяснить, как показано на рисунке 3.Предположим, что два соответствующих проецируемых пикселя точки сцены, глубина которых находится в соседних кадрах, находятся и, лежащие в одинаковой строке сканирования, то есть,; тогда несоответствие становится. Если задано фокусное расстояние, согласно принципу аналогичного треугольника, мы имеем


Он показывает, что если задана глубина фиксированной точки, то определяется несоответствие между ее соответствующими проецируемыми пикселями. И наоборот, глубина также может быть рассчитана по диспаратности.Основываясь на этом фундаментальном соответствии, их легко преобразовать друг в друга. С увеличением глубины несоответствие уменьшается до 0 в бесконечных точках, тогда как ближайшая точка с максимальным несоответствием обозначается как. Таким образом, диапазон диспаратности произвольных точек в сцене обычно дискретизируется, как в пикселях. Согласно приведенному выше соотношению соответствия, объем карты глубины может быть вычислен между каждыми двумя соседними кадрами из поля диспаратности, путем сопоставления одного с эталонным и отображения на дискретное пространство диспаратности для получения диспаратности каждого пикселя в эталонном кадре. .В этой статье мы упрощаем алгоритм оценки диспаратности из [22] и вычисляем глубинную когнитивную разность значимости на основе фильтра диспаратности среднего сдвига, предполагая, что значения диспаратности плавно изменяются в однородных регионах, а разрывы по глубине возникают только на границах регионов. Конкретные шаги для расчета карты глубины следующие.

Шаг 1 (сегментируйте однородные области по среднему сдвигу). Мы применяем алгоритм среднего сдвига, чтобы разложить опорный кадр на области однородного цвета или оттенков серого.Легко сверхсегментировать весь регион на несколько регионов, что предпочтительнее здесь для удовлетворения предположения о дисперсии диспаратности на практике.

Шаг 2 (вычисление стоимости локального соответствия двунаправленным способом). Принимая каждую пару соседних кадров в качестве эталонного изображения и согласованного изображения, стоимость совпадения пикселей и несоответствие между эталонным кадром и согласованным кадром в локальном окне вычисляются двунаправленным способом. Рассмотреть возможность

Критерий соответствия объединяет сумму абсолютных разностей (SAD) и абсолютных разностей градиентов (GRAD).Он адаптируется к изменениям сцены и обеспечивает лучшую точность, особенно на поверхности с текстурами.

Шаг 3 (оценка начальной карты диспаратности с помощью перекрестной проверки и WTA). Для обнаружения ненадежных совпадений используется процедура перекрестной проверки стоимости двунаправленного сопоставления в сочетании со стратегией оптимизации «победитель получает все» (выбор несоответствия с наименьшей стоимостью сопоставления). Если задан диапазон несоответствий, в котором число дискретных несоответствий становится равным, то начальное согласованное несоответствие опорного кадра равно

Шаг 4 (упростите вычисления, отфильтровав карту диспаратности на основе сегментов среднего сдвига).При условии, что значения диспаратности плавно изменяются в однородных областях, а скачки глубины возникают только на границах областей, для каждой однородной области вычисляется одно значение глубины. Первоначальная карта диспаратности фильтруется, принимая среднее значение диспаратности каждого сегмента среднего сдвига как весь его параллакс, то есть

После вышеуказанных шагов вычисления диспаратности информация о глубине получается косвенно. Наконец-то мы можем преобразовать объем карты диспаратности в объем карты глубины.

4. Оптимизация траектории с помощью построения графика

Поскольку столбцы входных кадров считаются основными элементами для формирования выходного коллектора, каждый столбец входных изображений рассматривается как узел, так что объем видео может быть абстрагирован как график. Позвольте обозначить граф, как показано на рисунке 4. Узлы — столбцы изображения. Ребра кодируют возможные переходы между столбцами. И каждое ребро имеет связанную стоимость перехода, то есть стоимость сокращения, определяемую как вышеупомянутое отличие когнитивной значимости от томов гибридных визуальных когнитивных карт.


Во время расчета стоимости, из-за нестабильности двухточечного сравнения столбцов, мы вычисляем гибридную когнитивную разницу между окнами и в их центрированных прямоугольных окнах. Более того, нет необходимости добавлять к графу все возможные ребра, поскольку кадры поступают из видеопоследовательностей с высоким перекрытием. Только те ребра среди ближайших участков, как те, что обозначены пунктиром на Рисунке 4, вычисляются в зависимости от ожидаемой максимальной скорости движения.

Цель оптимизации пути резки — найти кратчайший путь от до.Это сводит к минимуму затраты на резку вдоль траектории реза, в которой выступающие области сохраняются с минимальной деформацией, насколько это возможно. Из-за эффективности алгоритма Дейкстры [23] для решения задачи о кратчайшем пути между заданными узлами в графе с неотрицательными краевыми затратами мы применяем его для поиска пути отсечения от начального кадра до конечного кадра. Предположим, что это исходный узел и целевой узел. Основная идея алгоритма состоит в том, чтобы вычислить кратчайший путь и расстояние от до всех возможных переходных узлов в порядке их расстояния до.Он останавливается до тех пор, пока или не охватит все возможные переходные узлы. Между тем, используются метки, чтобы избежать повторения и сохранить вычислительную информацию о каждом шаге. Шаги алгоритма следующие.

Шаг 1. Установить, и, для. Если, то остановись; в противном случае перейдите к Шагу 2.

Шагу 2. Для каждого in, то есть, замените на. Когда , . Если заменяется, поставьте этикетку.

Шаг 3. Вычислить, и обозначить соответствующий узел как; тогда пусть.

Шаг 4. Если, то остановиться. Если, то замените на и переходите к шагу 2.

После оптимизации траектории разреза динамического тома выберите полосы столбцов в каждом кадре в соответствии с траекторией и вставьте их вместе в большой адаптивный коллектор. Сцена выходного сшивания создается без деформаций или других искусственных дефектов.

5. Эксперименты и сравнения

Чтобы подтвердить эффективность предложенного алгоритма при работе с движущимися объектами, мы сняли серию видеопоследовательностей в ранее описанном режиме движения камеры.В видеороликах задействованы различные сложные человеческие движения. Предложенный метод также сравнивался с двумя другими алгоритмами мозаики многообразия [6, 8].

Два типичных примера динамического сшивания сцен показаны на рисунках 5 и 6. Визуальные когнитивные карты различных значимых стимулов показаны на рисунках 5 и 6, на которых (а) s — исходные входные данные в интенсивности серого, (b) s — карты выступов контуров на основе ПК, а (c) s — карты выступов по глубине. Результаты сшивки [6, 8] и предлагаемый нами алгоритм показаны на рисунках 7–9 соответственно.Ссылка [6] сначала оценивает глобальные параметры движения между соседними кадрами, повторяя оптический поток Лукаса-Канаде в соответствии со стратегией гауссовой пирамиды. Затем полосы выбираются из середины видеокадров в соответствии с классической техникой многослойной мозаики. Окончательные выходные мозаики составлены без какого-либо априорного восприятия или оптимизации. Алгоритм из [6] может полностью сшить фон сцены, но он плохо справляется с нежесткими движущимися объектами, как показано на рисунке 7.Вместо того, чтобы рассматривать сшивание сцены как геометрическое выравнивание, [8] представляет его как минимальное искажение внешнего вида на уровне чистой обработки пикселей. Алгоритм из [8] показывает некоторую эффективность при сохранении умеренно движущихся объектов во время сшивания, поскольку идущий человек в сцене 1 лишь немного удлинен; см. рисунок 8 (а). Тем не менее, когда сцена содержит более сложные движения, такие как движения человека, чистящего доску, в сцене 2, движущийся объект будет легко обрезан, как показано на рисунке 8 (b).Производительность алгоритма из [8] требует улучшения. Результаты сшивания предлагаемого метода показаны на Рисунке 9. И соответствующие траектории разреза показаны на Рисунке 10. Можно видеть, что, управляемая моделью визуального познания, траектории разреза успешно избегают разрезания заметных областей движения и фона. также, в то время как два других алгоритма не могут гарантировать целостность движущихся объектов в разной степени, особенно когда объект движется с высокой мобильностью, поскольку их многочисленные процессы синтеза игнорируют визуальный когнитивный механизм, стимулируемый многоканальными особенностями.


(a) Динамическая сцена 1
(b) Динамическая сцена 2
(a) Динамическая сцена 1
(b) Динамическая сцена 2
(a) Динамическая сцена 1
(b ) Динамическая сцена 2
(a) Динамическая сцена 1
(b) Динамическая сцена 2
(a) Динамическая сцена 1
(b) Динамическая сцена 2
(a) Динамическая сцена 1
(b) Динамическая сцена 2
(a) Динамическая сцена 1
(b) Динамическая сцена 2
(a) Динамическая сцена 1
(b) Динамическая сцена 2

После последовательности Экспериментальные испытания показывают, что предложенный метод устойчив к различным динамическим движениям.Когнитивная модель, основанная на гибридной значимости, прекрасно гарантирует эффект сшивания. Предлагаемый метод позволяет эффективно решать задачу сшивки динамических сцен.

6. Выводы

В этой статье исследуется динамическое сшивание видеопоследовательности, особенно в ситуации, когда сцена, снятая на подвижной платформе, содержит движущиеся объекты или другие важные интересные области. Это большая проблема — сохранить движущиеся объекты и выступающие области в конечном сшитом изображении в их первоначальном виде без каких-либо потерь или деформации.В своей исследовательской работе мы исходим из визуального когнитивного механизма человека и анализируем несколько визуальных стимулов, чтобы построить когнитивную модель, основанную на гибридной значимости. Ограниченные этой моделью и объединенные с многоуровневым фреймворком мозаики, мы предложили эффективный алгоритм сшивания динамических сцен без какой-либо калибровки камеры и оценки движения. Он может полностью раскрыть роль зрительного когнитивного механизма человека в синтезе изображений для глобальных сцен и разумно избежать синтетических дефектов, таких как размытие движения и отсечение объектов.Результаты экспериментов показывают, что предложенный метод работает достаточно хорошо. Его можно применять к широкополосной системе мониторинга для поддержки суждений и принятия решений о глобальной ситуации или других расследований безопасности. Следующая цель — изучить чувствительность к выбору параметров в модели познания, сотрудничая с количественной оценкой сшивки.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов в отношении публикации данной статьи.

Благодарности

Эта работа поддержана Проектом Китайского научного фонда постдокторантов (№ 2013M540863) и Национальной программой исследований и разработок в области ключевых технологий в 12-м пятилетнем плане Китая (№ 2013BAI13B06).

Границы | LenSelect: выбор объектов в виртуальных средах с помощью динамического масштабирования объектов

1 Введение

Выбор (также известный как захват цели) виртуальных объектов в 3D — одна из четырех универсальных задач взаимодействия, определенных Bowman et al.(2004). Можно утверждать, что хорошо продуманная методика выбора — один из наиболее важных аспектов дизайна VR-опыта (Mine, 1995). При этом следует принимать во внимание интуитивность и беспроблемное использование техники, среднее количество ошибок и потенциальное разочарование пользователей, а также потенциальную усталость, которые могут привести к снижению производительности или признанию пользователей.

В отличие от 2D-среды выбор в 3D-среде сложнее. С точки зрения пользовательского интерфейса одной из причин является большее количество степеней свободы (DOF), присущее задаче.Таким образом, пользователь не только должен контролировать большее количество степеней свободы, но и отображение между пространством управления и пространством отображения может быть более сложным в случае неизоморфных методов. Кроме того, могут возникать проблемы с отсутствием точности и утомляемостью, особенно в загроможденной местности или с движущимися целями.

Хотя существует много принципиально различных способов выбора объектов в виртуальных средах [см., Например, Steed (2006) для получения информации о таксономии и Teather and Stuerzlinger (2013), Bacim et al.(2013) в качестве примеров], мы сосредотачиваем наше обсуждение на парадигмах выбора, которые используют какое-то указывающее устройство с 6 степенями свободы и используют некую однофазную парадигму, основанную на лучах. Причины в том, что текущее потребительское оборудование виртуальной реальности включает такие устройства и что методы выбора на основе лучей считаются очень интуитивно понятными; кроме того, они не нарушают ощущение присутствия. Более того, есть свидетельства того, что метафоры, основанные на лучах, обеспечивают лучшую производительность для пользователей, чем, например, методы плоскости изображения (Bowman et al., 1999).

Однако одна проблема методов выбора на основе лучей в VR заключается в том, что эффективная целевая ширина 3D-объектов уменьшается по мере увеличения расстояния от пользователя, подобно эффекту перспективного ракурса. Это связано с тем, что ширина цели, а также ее «расстояние», которые являются важными параметрами в законе Фиттса (MacKenzie, 1992; MacKenzie, Buxton, 1992; Kopper et al., 2010), должны измеряться в угловом пространстве. поскольку пользователи обычно сохраняют положение устройства ввода на месте.Таким образом, индекс сложности зависит не только от расстояния вращения и ширины в моторном пространстве, но и от глубины объекта в пространстве отображения. Конечно, это проблема не только для удаленных объектов, но и для небольших объектов, сильно загроможденных сцен с закрытыми объектами и для движущихся объектов.

Мы представляем новый метод выбора на основе лучей под названием LenSelect , ориентированный на такие сложные сценарии. Сравнение нашей техники и стандартной выборки на основе лучей можно увидеть на рисунке 1.Основная идея нашего нового метода выделения на основе лучей LenSelect основана на методах focus + context. Чтобы достичь бесшовной и интуитивно понятной интеграции в виртуальную среду, мы определяем нелинейное преобразование геометрии, которое выглядит для пользователя как искажение линзы. Это можно легко реализовать в шейдере на графическом процессоре, так что требуются лишь очень небольшие изменения в архитектуре системы VR. Используя этот эффект линзы, LenSelect обходит закон Фиттса, увеличивая эффективную ширину цели, не слишком сильно влияя на пространственное присутствие пользователя.

РИСУНОК 1 . LenSelect в действии (в центре и справа) по сравнению с Ray Selection (слева) .

Чтобы оценить наш метод, мы осознали отсутствие стандартизированных сценариев оценки, которые позволили бы сравнить большое разнообразие представленных методов отбора. Исследования показали, что не существует лучшей техники отбора для всех ситуаций. Требования к задаче могут сильно различаться, а условия для метода выбора могут меняться в зависимости от структуры среды, конкретной задачи и предпочтений пользователя (Wingrave et al.2005a; Wingrave et al., 2005b; Cashion et al., 2012).

Следовательно, мы определили набор интересных сценариев для исследования методов выбора на основе лучей с особым акцентом на реалистичную, плотную и динамическую среду. Это включает определение девяти тестовых сцен, включая реалистичную сцену с беспорядочным распределением объектов нескольких размеров, а также несколько искусственных сцен и наборов динамически движущихся объектов. Мы создали наши тестовые сцены на широко используемом игровом движке с открытым исходным кодом, Unreal Engine, и мы сделаем их доступными онлайн на сайте blindedforreview, чтобы другие исследователи могли использовать их для сравнения других методов выбора.Конечно, извлечение или повторная реализация сцен в других системах VR также проста.

Используя наши тестовые сцены, мы провели количественное и качественное сравнение нескольких современных методов выбора на основе лучей в пользовательском исследовании с учетом типичных параметров, таких как время выполнения задачи, ошибки выбора и индекс сложности. В наше исследование пользователей мы включили традиционную реализацию raycast (далее именуемую RaySelection), IntenSelect де Хаана и др.(2005), развернуть Cashion et al. (2012), а также два разных варианта LenSelect. Мы включили количественные показатели, такие как время завершения и количество ошибок, но также измеряем пользовательский опыт с помощью соответствующей анкеты на основе QUESI (Hurtienne and Naumann, 2010).

Результаты показывают, что RaySelection и LenSelect — самые быстрые и интуитивно понятные методы в большинстве сценариев; однако LenSelect имеет значительно меньше ошибок выбора, как и Expand, особенно со сложными сценами.Есть только одна тестовая сцена, сцена с быстро движущимися объектами, где IntenSelect работает лучше всего, но за счет значительно худшей производительности во многих других.

2 Связанные работы

Проблема обнаружения цели («выбор») как в иммерсивных, так и в не иммерсивных интерактивных графических системах возникла с момента появления виртуальных сред, что привело к огромному количеству литературы. Bowman et al. (2004) представили таксономию и договор ряда хорошо известных методов.Кроме того, Argelaguet et al. (2008) представляют собой краткое изложение классических методов, основанных на лучах / конусах, и их расширении.

Луч — очень интуитивная метафора для трехмерного выбора. Следовательно, многие исследователи изучали методы повышения точности в загроможденных средах, в больших рабочих объемах или для гибридных интерфейсов. Одна из идей состоит в том, чтобы увеличить ширину указателя (Zhai et al., 1994), тем самым увеличивая эффективную ширину цели (Kabbash and Buxton, 1995). Однако для устранения неоднозначности выбора требуются более сложные методы, поэтому был предложен ряд методов, например.грамм. (Wingrave et al., 2001; Olwal et al., 2003; de Haan et al., 2005; Steed, 2006). Другой подход состоит в изменении соотношения контроль-отображение (C / D), тем самым изменяя эффективную ширину цели (Andujar and Argelaguet, 2006; Andujar and Argelaguet, 2007; de Haan et al., 2006). IntenSelect de Haan et al. (2005) полагается на технику на основе конуса с механизмом устранения неоднозначности, основанным на функции подсчета очков в зависимости от положения объектов внутри конуса. Поскольку пользователю не всегда очевидно, как именно работает устранение неоднозначности, во время выбора пользователю следует дать соответствующую обратную связь.Распространенной практикой является использование изогнутых лучей (de Haan et al., 2005; Olwal and Feiner, 2003; Riege et al., 2006; Andujar and Argelaguet, 2006; Andujar and Argelaguet, 2007; de Haan et al., 2006). .

Другой подход — концептуально разделить пространство на области Вороного с объектами, обеспечивающими участки. Таким образом, области определяют эффективную ширину целей, что было предложено с помощью метода пузырькового курсора (Vanacken et al., 2007). Лу и др. (2020) представили улучшенную технику пузырькового курсора для выбора в трехмерной среде с другим определением цели, ближайшей к лучу, и другой обратной связью с пользователем (включая диск, визуализирующий пузырь и изогнутый луч).Этот метод оказался конкурентоспособным по сравнению со старой версией и, похоже, предпочитается пользователями (Lu et al., 2020). Наш метод отличается от пузырькового курсора тем, что он динамически увеличивает фактическую ширину объектов; Фактическая цель в курсоре Пузыря имеет форму не объекта, а статического выпуклого многогранника (то есть области Вороного).

Другие подходы заключаются в разделении задачи либо по размерам (Pierce et al., 1997; Wyss et al., 2006; Benko and Feiner, 2007), либо путем последовательного сокращения набора возможных объектов, как предлагается, например.g., с помощью техники SQUAD (Kopper et al., 2011). Точно так же Expand (Cashion et al., 2012) улучшает итеративный метод выбора SQUAD. С помощью этих подходов объекты часто в какой-то момент вынимаются из исходного контекста сцены и по-разному представляются пользователю (например, на дополнительном слое сетки), что потенциально может нарушить ощущение присутствия.

Несколько исследователей исследовали эффективность расширения цели во время захвата цели (Sarkar and Brown, 1992; Zhai et al., 2003; Хорнбек и Герцум, 2007; Шумейкер и Гутвин, 2007). Техника Go-Go (Bowman and Hodges, 1997a) и ее расширение Stretch Go-Go (Bowman and Hodges, 1997a) пытаются приблизить объекты к пользователю путем нелинейного масштабирования радиального расстояния виртуальной руки пользователя от тело пользователя, сохраняя при этом изоморфное масштабирование руки пользователя в тангенциальных направлениях. PRECIOUS работает наоборот, телепортируя пользователя близко к цели для захвата цели, а затем отправляя его обратно в исходное местоположение (Mendes et al., 2017).

В 2008 году Аргелагет и Андухар (2008) представили идею, аналогичную нашей. Тем не менее, они в основном сосредоточились на аналогичном подходе к тому, что мы называем масштабированием «Одинаковый размер», и не исследуют другие типы линз. Мы подробно расскажем о различиях в нашем подходе в Разделе 3.3. В отличие от нашего подхода, авторы использовали реализацию ЦП, и им приходилось поддерживать структуру данных графа во время выполнения, что еще больше увеличивает время выполнения. Более того, они протестировали свой подход на ограниченном количестве нестандартных тестовых сцен, и они не включали динамические сцены.Это затрудняет сравнение результатов. Тем более, что их эксперименты проводились в пещере вместо HMD, которые сегодня гораздо более распространены. Наконец, авторы не включили измерение индекса сложности для сравнения. Фактически, предложенное ими предотвращение окклюзии могло привести к увеличению индекса сложности. Однако результаты были аналогичны нашему подходу; оба метода имеют одинаковое время выбора по сравнению с RaySelection, но оба уменьшают ошибки выбора.

Наш подход можно рассматривать как развитие этой идеи. В этой статье мы тестируем несколько подходов к масштабированию объекта в форме четырех функций масштабирования.

Другие исследователи объединили разные методы, пытаясь объединить преимущества каждого из них, чтобы получить дополнительную производительность. Техники можно комбинировать «одну за другой» (Гроссман и Балакришнан, 2006) или использовать одну основную технику, в то время как другая действует как уточнение для определенных условий (de Araujo e Silva, 2015).

Большинство методов выбора вычисляются на CPU с использованием традиционных методов ускорения пересечения лучей и сцен, известных из трассировки лучей; на графическом процессоре стандартные методы обычно включают дополнительный проход по сцене с использованием (очень тонкой) усеченной вершины, определяемой лучом. Более поздний подход предлагает ряд проходов, реализующих последовательную фильтрацию объектов и треугольников с помощью нескольких запросов окклюзии (Zhao et al., 2009).

В области 3DUI было предложено несколько методов, которые в некоторой степени связаны с нашей.Один из таких методов предлагает управлять окклюзиями в плотных трехмерных сценах путем смещения и перемещения объектов «в сторону», где центр фокуса определяется трехмерным курсором, отсюда и название BalloonProbe (Elmqvist and Tudoreanu, 2007; Elmqvist and Tudoreanu, 2006 г.). Этот метод отличается от нашего, потому что он не масштабирует объекты на месте, и авторы не применяли его для выполнения задач трехмерного выбора.

3 Обзор LenSelect

В этом разделе мы подробно представляем дизайн, реализацию и теоретические соображения, лежащие в основе LenSelect.Фундаментальная идея нашего метода основана на соблюдении закона Фиттса, согласно которому большая ширина цели приводит к меньшему времени выбора и меньшему количеству ошибок выбора (MacKenzie, 2018).

Базовая формулировка закона Фиттса обеспечивает модель среднего времени выбора MT:

Здесь a , точка пересечения, и b , наклон, являются константами, определенными эмпирическим путем, зависящими от многих факторов, например тип устройства. Следуя этой формулировке, Индекс сложности, ID, можно определить как:

ID обеспечивает простую меру сложности задачи выбора (MacKenzie, 2013).Это зависит от расстояния A между указателем и объектом, а также от ширины цели W в направлении движения указателя. Фиттс описывает W также как допуск перемещения , то есть ошибку, которую пользователь может совершить, все еще имея возможность выбрать объект (MacKenzie, 2018). LenSelect увеличивает допуск на перемещение, интуитивно увеличивая эффективную ширину объекта. Хотя исходная формула была разработана Фиттсом для одномерного захвата цели, он также обычно используется для 2D- и 3D-захвата цели.В 3D ширина цели обычно определяется как угол, под которым виден объект с точки зрения пользователя (Kopper et al., 2010).

LenSelect — это расширение стандартной техники выделения лучей. При выборе луча луч испускается указательным устройством в указанном направлении. Первый объект, пересекающийся с лучом, выбирается, когда пользователь нажимает кнопку выбора. Выбор лучей — это очень интуитивно понятный метод, но он может быть довольно сложным в загроможденных сценах или с целями на расстоянии.Основная идея LenSelect состоит в том, чтобы изменить эффективный размер потенциальных целевых объектов, таким образом, уменьшив ID в соответствии с законом Фиттса. Это достигается за счет включения эффекта линзы , который увеличивает объекты внутри конуса, кончик которого находится на указательном устройстве, а ось конуса задается указательным лучом.

В общем, в LenSelect есть два основных параметра: угол раскрытия конуса α, который определяет, на какие объекты в сцене влияет эффект линзы, и, во-вторых, уравнение, по которому определяется окончательный масштаб.Теоретически можно было поэкспериментировать с формой линзы, однако конус быстро оказался наиболее эффективным.

Настоящая оптическая линза масштабирует всю сцену внутри себя, LenSelect, с другой стороны, масштабирует только отдельные объекты в зависимости от расстояния до луча. Это означает, что мы можем еще больше уменьшить перекрытие между объектами, выборочно масштабируя их. Чтобы сделать масштабирование и переходы плавными, мы увеличиваем объекты тем больше, чем ближе они к центральной оси конуса, т.е.е., собственно луч. Кроме того, эти объекты с большей вероятностью будут выбраны пользователем. Для этого мы просто вычисляем минимальное расстояние, d , между поверхностью каждого объекта (его сеткой) и осью конуса, т.е. мы вычисляем точку на поверхности объекта, ближайшую к оси, а затем берем это расстояние.

Далее мы дополнительно нормализуем расстояние так, чтобы точка на луче (то есть ось конуса) имела нулевое расстояние, а точка на краю линзы — расстояние один:

, где d — минимальное расстояние между испускаемым лучом и поверхностью объекта, а r — радиус конуса на этом расстоянии (см. рисунок 2).Это облегчает определение и представление фактических функций масштабирования. Далее мы предлагаем ряд функций масштабирования, но можно определить и многие другие. Для нашего исследования пользователей мы выбрали эти два метода, которые показали наилучшие результаты в предварительном исследовании. Дополнительно оценивались два гиперпараметра: видимость линзы и угол раскрытия. Согласно нашему предварительному исследованию, линза должна оставаться видимой (мы выбрали непрозрачность 0,1 для увеличения видимости объектов), а угол раскрытия линзы составляет 15 °.

РИСУНОК 2 . LenSelect масштабирует объекты в зависимости от их расстояния d до луча выделения. Расстояние d нормализовано радиусом конуса r на расстоянии u от указательного устройства.

3.1 Линейное масштабирование

Самый простой метод — это масштабировать размер объекта линейно относительно расстояния до границы конуса dn:

s = 1 + (1 − dn) ⋅ (sm − 1) (4)

Окончательный коэффициент масштабирования объекта, s , линейно зависит от определяемого пользователем максимального коэффициента масштабирования sm> 1.Где 1-dn описывает, сколько sm применяется к окончательной шкале.

3.2 Масштабирование корня

Недостатком простого линейного масштабирования всего объекта является то, что оно может привести к взаимному проникновению и перекрытию масштабируемых объектов. Чтобы уменьшить этот нежелательный эффект, мы предлагаем метод уменьшения коэффициента масштабирования объектов, которые находятся ближе к границе конуса выделения. Этого легко добиться, выбрав нелинейный коэффициент масштабирования по отношению к расстоянию.Собственно, мы решили выбрать ту корневую функцию, которая хорошо работала в наших предварительных тестах.

Идея Масштабирование корня состоит в том, чтобы подчеркнуть масштабирование объектов, которые находятся ближе к центру линзы. Опять же, как и в случае с линейным масштабированием, мы увеличиваем масштаб исходного объекта до максимального коэффициента масштабирования sm.

s = 1 + (1 − dn4) ⋅ (sm − 1) (5)

Мы протестировали несколько корневых функций и выбрали четвертый корень, так как масштабирование быстро падает на первых 10% расстояния, но все еще удерживает объекты на расстоянии. разумный размер, если они выходят за пределы начального 10% интервала.

3.3 Масштабирование одинакового размера экрана

Перспективная проекция имеет свойство, заключающееся в том, что объекты кажутся меньше по мере увеличения расстояния до зрителя. Если мы не учитываем это свойство в LenSelect, становится сложнее выбирать объекты с увеличивающимся расстоянием. С другой стороны, при использовании ортогональной проекции объекты сохраняют свой размер независимо от расстояния, поэтому мы могли бы просто использовать этот вид проекции в качестве типа линзы. Однако перспективная проекция обычно выглядит лучше, особенно при использовании стереоскопических дисплеев, поскольку она напоминает наше обычное восприятие при просмотре.Следовательно, мы определяем тип линзы, который сочетает в себе независимость ортогональной проекции от расстояния со свойствами перспективной проекции. Очевидно, что, как и предыдущие типы линз, он влияет только на объекты внутри конуса выделения LenSelect.

Основная идея состоит в том, чтобы определить коэффициент масштабирования в мировом пространстве затронутых объектов в конусе по отношению к расстоянию. Для этого вводится глубина фокуса n . Объекты, находящиеся на расстоянии n от камеры, сохраняют свой исходный масштаб.Отсюда нам нужно учитывать соотношение между размерами усеченной области обзора на глубине фокуса fn и протяженностью пирамиды на расстоянии от объекта до камеры fu.

Таким образом, объекты, которые находятся дальше, чем n , будут увеличены, а объекты, которые находятся ближе, чем n , будут уменьшены. Последнее может быть желательно для уменьшения перекрытия в плотных сценах, близких к пользователю. Фактические размеры fu, fn можно легко вычислить с помощью простой тригонометрии.См. Также рисунок 3 для визуального обзора процедуры.

РИСУНОК 3 . Масштабирование одинакового размера экрана регулирует размер объекта в мировом пространстве Wo таким образом, чтобы проекция на экране имела одинаковую ширину Ws независимо от расстояния и до камеры. Он использует соотношение между шириной пирамиды на расстоянии и и шириной пирамиды на расстоянии n , чтобы определить масштаб объекта. Где n — значение, определяемое пользователем, которое описывает расстояние, на котором объект сохраняет свой исходный масштаб.На левом изображении показан увеличенный объект по сравнению с исходным масштабом, который объект имел бы на расстоянии n на правом изображении.

Кроме того, мы вводим нелинейный фактор, так что меньшие объекты больше выигрывают от масштабирования одинакового размера экрана, т. Е. Они имеют тенденцию казаться больше на экране, чем объекты, которые уже являются большими. Для этого мы вводим дополнительный множитель 1 + 1e, где e — размер объекта в мировом пространстве. В качестве простого приближения мы используем среднее значение трех границ его ограничивающего прямоугольника (OBB).

В целом окончательный масштаб для этого типа линз:

Однако в нашем предварительном исследовании масштабирование с одинаковым размером экрана оказалось хуже, чем простое масштабирование корня. Причина в том, что объекты резко «выскакивают» до другого размера, как только они попадают в конус LenSelect. Кроме того, оказавшись внутри, они никогда не меняют размер независимо от направления наведения. Это оказалось отвлекающим фактором для пользователей в нашем предварительном исследовании. Следовательно, мы не включали его напрямую в наше исследование пользователей, о котором сообщается ниже.

Кроме того, это уравнение показывает некоторое сходство с коэффициентом масштабирования, предложенным Argelaguet и Andujar (2008), но есть различия.Во-первых, их уравнение никогда не уменьшит размер объектов, в отличие от нашего. Это дает преимущества в загроможденной среде, потому что уменьшенный размер объектов, находящихся вдали от луча выбора, также уменьшит перекрытие и, следовательно, облегчит выбор объекта. Во-вторых, в случае длинного узкого объекта этот объект должен вырасти до невероятных размеров и, следовательно, создать сильное визуальное нарушение и перекрытие, чтобы удовлетворить условию, представленному Argelaguet и Andujar (2008). В нашем уравнении коэффициент масштабирования зависит только от расстояния до объекта по отношению к целевому расстоянию; объекты, находящиеся на одинаковом расстоянии от пользователя, получат такое же масштабирование (если мы проигнорируем дополнительное масштабирование, примененное из-за размера цели).

3.4 Комбинированное масштабирование

Хотя масштабирование с одинаковым размером экрана гарантирует, что удаленные объекты не «доминируют» близкие объекты, оно вносит разрыв в эти объекты. Однако этот тип линз оказался особенно полезным для выделения далеких объектов. Чтобы сохранить это свойство, мы просто объединили его с масштабированием корня.

Это приводит к общему коэффициенту масштабирования:

уравнение аналогично 5. Только постоянный максимальный коэффициент sm заменяется зависимым от расстояния коэффициентом масштабирования ss, полученным из масштабирования одинакового размера экрана.Таким образом, минимальный масштаб объекта равен 1 у границы конуса, а максимальный масштаб — ss в центре конуса.

4 Методология

В этом разделе мы описываем нашу методологию оценки, включая выбранные нами тестовые сцены, наш метод расчета идентификатора и анкету.

4.1 Оценка методов отбора

Исследования методов отбора в области взаимодействия человека и компьютера имеют долгую историю, и уже были предприняты некоторые попытки стандартизировать сценарии тестирования.Например, Bowman et al. (1999) предлагают испытательные стенды для оценки методов отбора на основе таксономии, показателей производительности и внешних факторов. Поупырев и др. (1997) определили список различных факторов, называемых параметрами задачи , которые следует учитывать при измерении эффективности метода выбора. Эти параметры могут зависеть от пользователя, устройств, способа взаимодействия, приложения и даже задачи.

Однако, насколько нам известно, нет общедоступных стандартных сценариев тестирования для методов выбора с 6 степенями свободы в виртуальных средах, особенно когда следует рассматривать сложные, плотные или реалистичные сцены.Часто для выделения используются только простые объекты, такие как кубы и сферы. Иногда для имитации реального варианта использования или более естественной среды используются более сложные объекты, например фрукты в фруктовом киоске.

Мы предлагаем новый стенд для оценочных испытаний, который мы сделаем общедоступным для исследовательского сообщества. Он состоит из набора статических и динамических тестовых сцен с четко определенными параметрами, некоторые из которых напоминают довольно реалистичные сценарии приложений, некоторые — довольно искусственные специфические характеристики тестирования.Наши тестовые сцены лучше всего оцениваются с помощью прилагаемого анкеты, основанной на QUESI (Hurtienne and Naumann, 2010). Использованный вопросник (сокращенный до одного метода отбора) можно найти в дополнительном приложении ??. Наконец, мы предлагаем методы для более точного расчета ширины и расстояния до целей, особенно в динамических и загроможденных сценах, чтобы можно было более точно рассчитать идентификатор в законе Фиттса.

4.2 Тестовые сцены

Самыми сложными задачами выбора, особенно в реальных приложениях, являются загроможденные среды.Следовательно, мы сосредоточились на таких сценах. Другие проблемы, которые часто не упоминаются в тестовых примерах, — это динамически перемещающиеся объекты. Мы разработали наши тестовые сцены с учетом наиболее важных факторов, предложенных Poupyrev et al. (1997). Сценарии тестирования, использованные Cashion et al. (2012) послужили основой для нашего дизайна, но были переработаны и скорректированы, чтобы лучше соответствовать параметрам задачи, изложенным в Poupyrev et al. (1997). Например, движущиеся кубы были заменены на сферы, так как таким образом ID остается более согласованным.Мы также почувствовали, что текстуры фруктов могут отвлекать или каким-то образом искажать результаты, и поэтому решили исключить такие потенциально смещающие факторы. Каждая сцена была разработана для проверки определенного условия, мы чувствовали, что большая разница в формах объектов могла запутать действительные результаты. Вот почему большинство сцен содержат одни и те же объекты, за исключением сцены Разное , которая была разработана специально для тестирования производительности с объектами разных форм и размеров.

Чтобы участники нашего пользовательского исследования могли управлять количеством задач выбора, мы ограничили количество тестовых сцен до девяти.Большинство наших сцен были разработаны для тестирования различных аспектов работы техник выделения, таких как, например, различная степень окклюзии или движения в сцене. Тестовая сцена «Разное» имеет конкретное сходство со сценарием из реального мира, в ней делается попытка включить оценку «в дикой природе». В целом, мы думаем, что наши тестовые сцены охватывают широкий спектр интересных и практически значимых случаев.

Мы надеемся предоставить набор сценариев, который подходит для будущих оценок методов отбора, поскольку сравнение различных методов отбора может быть затруднено с сильно различающимся в настоящее время дизайном задач отбора.Ниже перечислены наши тестовые сцены, включая наше обоснование их дизайна; изображения всех сценариев можно найти на рис. 4.

• Пропановые баллоны закрыты: в этом сценарии влияние расстояния пользователя оценивается как основной фактор влияния в реалистичном сценарии. Он состоит из двух рядов пропановых баллонов с небольшой окклюзией; три бака в переднем ряду и два в заднем. Мы тестируем этот сценарий на двух разных расстояниях.

• Пропановые баллоны далеко: точно так же, как баллоны с пропаном вблизи, за исключением большого расстояния.

• Разное: оценивает влияние размера объекта на технику выбора. Он состоит из разных реалистичных объектов разного размера и формы, которые немного загромождены.

• Составные кубы: этот сценарий тесно связан с традиционными задачами выбора 2D и, таким образом, оценивает производительность для таких простых, почти двумерных задач. Несколько кубиков складываются в три ряда перед участниками.

• Плотно установленные банки: в этом сценарии оценивается влияние сильной окклюзии на эффективность выбора; три ряда банок ставятся вплотную друг за другом.

• Быстро движущаяся одиночная сфера: чтобы оценить производительность быстро движущихся объектов с непредсказуемыми траекториями, мы включили эту сцену, в которой одиночная сфера перемещается по сцене случайным образом.

• Беспорядочно движущиеся сферы: этот сценарий охватывает тестовые случаи с непредсказуемыми движущимися объектами с небольшим перекрытием: десять сфер перемещаются беспорядочно. Они двигаются медленно, но также беспорядочно меняют направление.

• Плавающие сферы: в этом сценарии также тестируются задачи выбора 2D, т.е.е., у него нет окклюзий, но в отличие от Stacked Cubes он фокусируется на движущихся объектах с предсказуемой траекторией. Двенадцать сфер размещаются на определенном расстоянии от пользователя. Они медленно вращаются вокруг центра, подобно колесу.

• Вращающиеся банки: самая сложная задача — это маленькие движущиеся объекты с высокой степенью перекрытия. Следовательно, как и выше, мы поместили небольшие банки на стол в непосредственной близости, но теперь дополнительно на вращающийся стол.

РИСУНОК 4 . Наши девять различных сценариев тестирования, которые мы предлагаем и которые использовались в этом исследовании (верхний левый, баллоны с пропаном, обозначает две сцены, где баллоны с пропаном закрываются, а баллоны с пропаном далеко.Верхний ряд содержит статические сцены, а нижний ряд — динамические сцены. И статические, и динамические подмножества сцен содержат как больше, так и меньше загроможденных сред.

Чтобы установить четко определенное время для завершения задачи и четко определенное (угловое) расстояние до выбираемого объекта, пользователь должен коснуться сферы, которая находится в центре верхней части всей сцены перед каждым отборочное испытание. Как только пользователь касается этой начальной сферы, начинается отсчет времени для задачи выбора, и целевой объект выделяется на сцене.Это гарантирует, что записанное время не включает время, необходимое для поиска целевого объекта. Это также гарантирует, что каждому участнику нужно преодолеть одинаковое расстояние, чтобы достичь целевого объекта. Конечно, все пользователи располагались в одном и том же месте в виртуальной среде и не могли подойти ближе.

4.3 Расчет индекса сложности

Расчет сложности задачи отбора обычно можно выполнить с помощью закона Фиттса, как упоминалось выше. Однако вычисление расстояния и, особенно, ширины объектов может быть сложной задачей для объектов сложной формы, или для закрытых, или даже для движущихся объектов.Далее мы предлагаем метод оценки идентификатора в таких сложных сценариях.

Как правило, фактическое расстояние и ширину, необходимые для идентификатора, можно рассчитать, сделав снимок экрана из поля зрения камеры и подсчитав пиксели от исходного положения указателя до его конечного положения во время выбора (см. Рис. 5). Мы реализовали наши тестовые сцены в Unreal Engine. Пользовательский буфер трафарета Unreal Engine использовался для определения принадлежности каждого пикселя, что позволяет идентифицировать объекты по их соответствующему идентификатору, хранящемуся в пикселе буфера трафарета.Кроме того, при извлечении буфера можно применить пользовательский цвет. В нашем случае закрывающие объекты окрашены в голубой цвет, целевой объект — в желтый цвет, все остальное — в черный цвет. Следовательно, учитывая точки пересечения между лучом выделения и плоскостью изображения, мы можем просто проследить путь между этими точками и подсчитать пиксели; эти числа могут быть преобразованы в (угловую) ширину и расстояние и вставлены в уравнение 2 для определения ID каждого испытания. Следует иметь в виду, что только выбираемые части объекта считаются его шириной.Отверстия в объектах не включаются, см. Рисунок 5, где красные пиксели обозначают ширину объекта для данного выделения.

РИСУНОК 5 . Снимок экрана, на котором показан расчет нашего идентификатора с использованием буфера трафарета. Синяя часть линии показывает расстояние до цели, а красная часть (и) показывает ширину цели. Целевой объект представлен желтыми пикселями.

Для Expand и IntenSelect мы вычислили фактические идентификаторы немного по-разному, потому что стандартный подход в этих случаях не работает.

Для Expand ширина объекта остается прежней, а расстояние состоит из двух частей. Первый — это расстояние от начальной позиции указателя до позиции, где пользователь решает, какие объекты ему интересны (какие объекты будут выбираться в сетке). Вторая часть описывает переход от первого грубого выделения к выделению целевого объекта в сетке. В основном мы рассматриваем фактический путь указателя, прежде чем он сможет выбрать целевой объект.

Для IntenSelect пользователю не нужно напрямую указывать на объект, поэтому мы должны вычислить целевую область. Целевая область описывает все пиксели, которые привели бы к выбору целевого объекта. Это делается путем вычисления радиуса конуса на глубине объекта в мировом пространстве и проецирования полученного круга на холст так, чтобы его центр был выровнен с проецируемым центром объекта. Затем вычисляется оценка для каждого пикселя внутри этого круга, и пиксель окрашивается соответствующим образом.После этого ID может быть вычислен как обычно с помощью описанных выше методов.

Для движущихся объектов индекс сложности должен быть определен несколько иначе, чтобы учесть скорость цели относительно пользователя. Несмотря на то, что исследование этой конкретной проблемы довольно старое (Jagacinski et al., 1980), ресурсов мало. Используя систему управления первого порядка, Хоффманн (1990) вывел уравнение, близкое к исходному идентификатору Фиттса:

A описывает расстояние до цели, а W описывает ширину цели, как и в уравнении 1, где V — это расстояние до цели. скорость цели, где приближающаяся цель определяется как имеющая отрицательную скорость. K служит для определения критической скорости Vcrit, при которой преднамеренное обнаружение цели становится невозможным:

Значение K трудно измерить; Хоффман предложил два метода: во-первых, с помощью регрессионного анализа и, во-вторых, путем наблюдения критической скорости на «пороге» потери захвата цели (50% неудачных испытаний). Hajri et al. (2011) вывели уравнение, подобное уравнению Хоффмана, путем моделирования времени захвата цели.

Мы выбрали уравнение Хоффмана для вычисления идентификаторов движущихся объектов.Мы (более или менее произвольно) выбрали K = 100 после некоторых экспериментов, чтобы получить идентификаторы того же порядка, что и у стационарных объектов.

Для расчета стационарного ID мы полагаемся на уравнение 2, которое часто используется для двумерного захвата цели. Несколько модификаций, таких как учет силы тяжести (Мурата и Ивасе, 2001; Гроссман и Балакришнан, 2004), где предлагалось адаптировать расчеты к конкретным сценариям в 3D. Shoemaker et al. (2012) описали дополнительные ограничения в отношении различных уровней усиления управления-отображением.Они предлагают двухчастную формулировку методов выбора с неизоморфными отображениями. Все методы отбора, используемые в нашем исследовании, используют изоморфное отображение, поэтому мы его не рассматриваем.

4.4 Анкета

Помимо чисто количественных показателей, таких как время выполнения задачи, частота ошибок и т. Д., Взаимодействие с пользователем имеет важное значение для оценки методов взаимодействия. Обычно это измеряется анкетой. Мы предлагаем расширение анкеты QUESI, чтобы адаптировать ее к особым требованиям задач отбора в трехмерной среде.Обычно опросник QUESI используется для измерения субъективных критериев интуитивного использования и удовлетворенности пользователей (Naumann and Hurtienne, 2010). Он объединяет интуитивное использование с эффективным взаимодействием с пользователем, следовательно, он предлагает хорошую основу для принятия пользователем техники выбора. QUESI состоит из 14 вопросов, каждый соответствует одной из следующих пяти шкал: когнитивная нагрузка, предполагаемое достижение целей, воспринимаемое усилие при обучении, знакомство / предварительные знания и предполагаемый уровень ошибок.Среднее значение соответствующих вопросов, обычно измеряемое по пятибалльной шкале Лайкерта, составляет балл по каждой шкале. Среднее значение всех шкал определяет единое общее число QUESI, которое можно использовать для общего сравнения.

По данным Poupyrev et al. (1997) очень важно сохранять ощущение присутствия во время задач выбора в 3D VR-средах. Следовательно, полезно включить этот важный показатель в оценку пользователя. В QUESI эта шкала отсутствует, но в анкете INTUI она включена под термином «Волшебный опыт» (Ullrich and Diefenbach, 2010).Согласно INTUI, этой шкале соответствуют четыре пункта, но один из вопросов очень прямой и включает термин «Magic Experience». Определение и толкование этого термина расплывчато, поэтому мы удалили этот вопрос и включили три других вопроса в нашу расширенную анкету QUESI. Следовательно, наш модифицированный QUESI основан на шести шкалах вместо пяти. Следовательно, прямое общее число QUESI нельзя напрямую сравнивать с результатами предыдущей работы, но мы надеемся, что в будущем больше исследователей будут полагаться на наш метод тестирования и соответствующий вопросник.

Кроме того, мы добавили два элемента, чтобы измерить сложность и интересность метода взаимодействия, задав прямой вопрос: «Насколько сложным вам показался метод выбора?» и «Использование техники отбора — это весело». Все вопросы основываются на пятибалльной шкале Лайкерта.

В нашем исследовании пользователей, описанном в следующем разделе, мы также попросили участников в конце ранжировать все методы выбора по их предпочтениям, и мы включили краткую предварительную анкету с просьбой предоставить демографические данные, такие как предыдущий опыт работы с VR и видеоиграми, особенно шутеры от первого лица.Кроме того, мы добавили открытый вопрос, спрашивающий, были ли у участника проблемы с самим исследованием или системой, использованной для его проведения.

5 Исследование пользователей

В этом разделе мы опишем дизайн нашего исследования, а также детали трех методов отбора, с которыми мы сравниваем нашу работу. В общей сложности мы сравниваем пять различных техник отбора (два наших собственных), используя девять тестовых сцен, описанных в разделе 4.2.

5.1 Процедура исследования

В исследовании используется план внутри субъектов, когда все 20 участников оценивают все пять методов.Мы записали количественные данные, такие как время выполнения задачи, ошибки выбора и индекс сложности (ID), как определено в разделе 4.3. Для статических сцен мы вычисляем физический идентификатор в дополнение к эффективному идентификатору. Физический идентификатор — это идентификатор без какого-либо масштабирования, применяемого методом выбора, тогда как эффективный идентификатор учитывает целевое масштабирование. Кроме того, все испытуемые заполнили анкету после использования каждого метода (таким образом, в общей сложности каждый участник должен был заполнить пять анкет).

Участники вошли в обозначенное место в виртуальной среде, чтобы обеспечить равное расстояние до тестовых сцен. Для каждого метода выбора участники сначала входили в режим практики без ограничения по времени. Когда участники чувствовали себя комфортно, они входили в собственное исследование. Они должны были сделать несколько вариантов выбора для каждой сцены: 10 при выборе баллонов с пропаном, 20 в другой сцене и пять во всех остальных средах. Каждая техника выбора была оценена на всех сценах, как описано в Разделе 4.2. Чтобы избежать эффектов обучения между техниками, мы рандомизировали порядок выбора техник и сцен в соответствии с латинским квадратом.

Мы посчитали подходящим разное количество испытаний, чтобы уменьшить потенциальные эффекты обучения в сценах с небольшим количеством целевых объектов. В противном случае мышечная память может исказить результаты последовательных повторений раундов. В таких сценах, как среда «Разное», это было меньшей проблемой, поскольку здесь каждый выбор был нацелен на другой объект, в другом месте, с другим размером и формой.Другая причина заключалась в том, что мы не хотели слишком сильно напрягать терпение участников, чтобы не вызывать усталости или скуки (им не выплачивалась компенсация за их участие).

Далее мы даем краткий обзор двух конкурирующих современных методов отбора, которые мы включили в наше исследование пользователей. Во-первых, мы выбрали IntenSelect, потому что его основная идея аналогична LenSelect. Во-вторых, Expand был выбран потому, что это хорошо известный член семейства прогрессивных многоэтапных методов отбора, которые, как правило, работают медленнее, но менее подвержены ошибкам выбора.Наконец, мы включили классическое выделение на основе лучей как своего рода базовую линию.

5.2 Конкуренты

5.2.1 Expand

Expand — это эволюция техники отбора отрядов; оба являются многоэтапными подходами к выбору объекта. Expand пытается облегчить проблему потери исходного контекста объектов, что особенно полезно для похожих объектов. Вместо того, чтобы итеративно упорядочивать объекты-кандидаты в квадранты экранного пространства, Expand выравнивает копии объектов в сетке экранного пространства.Эта сетка создается динамически в зависимости от количества объектов, которые необходимо разместить, чтобы максимально увеличить пространство на экране. На втором этапе пользователь выбирает цель из сетки (Cashion et al., 2012). См. Правую часть рисунка 6, где показан снимок экрана этого второго этапа нашей реализации.

РИСУНОК 6 . Скриншоты наших реализаций двух современных методов выбора, использованных в нашем исследовании пользователей: IntenSelect (слева) и Expand (справа).

Expand, однако, не без проблем.Например, расположение объектов в сетке не упорядочено по интуитивному критерию. Кроме того, объекты, полностью закрытые в 3D, также отображаются в сетке, что может сбивать с толку пользователей.

Expand в нашем исследовании служит для сравнения ошибок выбора. В случае двухэтапного метода выбора вероятность ошибок должна быть ниже, чем у других одноэтапных методов, что обеспечивает некую основу для этого показателя производительности.Мы считаем важным включить представителя семейства многоэтапных методов отбора, хотя мы не ожидаем, что он превзойдет какие-либо одноэтапные методы с точки зрения времени выполнения задачи.

5.2.2 IntenSelect

IntenSelect был разработан для решения трех аспектов выбора: точности, неоднозначности и сложности de Haan et al. (2005). IntenSelect — это техника на основе конуса с механизмом устранения неоднозначности. Он использует луч изгиба, исходящий от устройства в указанном направлении и изгибающийся к текущему выбранному объекту.Кроме того, он отображает второй прямой луч, указывающий в направлении устройства (но его можно не указывать). Слева на рисунке 6 показан снимок экрана нашей реализации.

IntenSelect предлагает механизм оценки объектов, основанный на угле между центром объекта и центральной линией конуса. Этот угол задается с помощью arctandperpdproj, где dperp — это расстояние объекта от центральной линии конуса, а dproj — расстояние вдоль этой линии. Далее авторы вводят параметр k , чтобы «сузить» оценку с глубиной, так что окончательная мгновенная оценка будет

scontrib (t) = 1 − arctandperp (t) (dproj (t)) kβ (11)

, где β — параметр, определяющий угол раскрытия конуса.Чтобы избежать быстрого переключения между целями, они вводят своего рода временной гистерезис, в результате чего получается окончательная оценка

stotal (t) = stotal (t − 1) ⋅cs + scontrib (t) ⋅cg (12)

где параметры cs и cg определяют «липкость» и «мгновенность», соответственно. Таким образом, эффективная ширина цели каждого объекта расширяется до сферы вокруг его центральной точки, в зависимости от других объектов поблизости.

Однако этот метод может привести к проблемам в сильно загроможденных областях: в таких случаях эффективная целевая область объекта может сжиматься ниже размера целевого объекта.Эта эффективная целевая область может даже быть «смещена» от целевого объекта, видимого пользователю. В худшем случае целевая область может полностью лежать за пределами видимого целевого объекта; это так, если есть близкие объекты перед целевым объектом и позади него. Другая неинтуитивная ситуация может возникнуть, например, если центральная точка целевого объекта перекрывается другим объектом; тогда целевой объект все еще может быть выбран через перекрывающийся объект.

6 Результаты

Мы использовали методологию, описанную выше, для проведения пользовательского исследования.Сначала мы представим общие результаты нашего исследования. Затем мы сосредотачиваемся на количественных результатах, прежде чем сообщать результаты анкеты.

В основном исследовании приняли участие 20 участников, 15 из которых идентифицировали себя как мужчины, а пять — как женщины. Большинство из них были либо научными сотрудниками, либо студентами. Четыре человека были левшами, и ни у одного из них не было дальтонизма. Их возраст варьировался от 20 до 35 лет, средний возраст — 26,7 года, стандартное отклонение — 4,3, а медиана — 27,5. Все, кроме двух участников, раньше использовали HMD.В общей сложности семь участников уже приняли участие как минимум в одном предварительном исследовании.

Перед основным исследованием мы провели два предварительных исследования с 7 участниками в каждом для определения гиперпараметров LenSelect. В первом предварительном исследовании мы обнаружили, что методы корневого и комбинированного масштабирования были наиболее многообещающими версиями LenSelect. В ходе второго предварительного исследования мы обнаружили, что угол раскрытия α, равный 15 °, был лучшим вариантом и что визуализация конуса работала лучше, чем его скрытие.

Во всех экспериментах участники носили HTC Vive Pro.Две базовые станции использовались для отслеживания передвижения пользователя. Для обозначения выбора участники использовали кнопку триггера. Хотя это может вызвать ошибки выбора из-за эффекта пространственного взаимодействия Гейзенберга (Wolf et al., 2020), поскольку все методы используют одну и ту же кнопку для индикации, что ошибка должна распространяться среди них одинаково. HMD был подключен к ПК с Windows 10 с процессором Intel Core i7 7800X на 3,5 ГГц, 64 ГБ ОЗУ и графическим процессором NVidia Titan V. Мы реализовали все тестовые сцены и методы выбора с помощью Unreal Engine 4.21.2.

6.1 Статистические методы

Мы используем дисперсионный анализ (ANOVA) для статистической интерпретации следующих результатов. Как тестирование нормальности с помощью теста Шапиро-Уилка, так и визуализация данных в виде гистограммы показывают, что образцы не обязательно следуют нормальному распределению как для вопросника, так и для количественных данных. Тест Левена также показывает, что гомоскедастичность не всегда применима к количественным результатам. Поэтому мы выбрали дисперсионный анализ Уэлча с последующим апостериорным тестом Геймса-Хауэлла для анализа количественных данных.Тест Велча рекомендуется, если данные не распределены нормально и дисперсии не равны. Тест является надежным в отношении различных размеров выборок и ненормальных данных, даже если применяются некоторые условия (Cribbie et al., 2012). Тест Геймса-Хауэлла также устойчив к ненормальности и работает с неравными отклонениями.

Для результатов анкеты мы выбрали тест Краскела – Уоллиса с последующим апостериорным тестом Тьюки. Параметрические и непараметрические тесты часто одинаково хорошо работают для данных шкалы Лайкерта с большим размером выборки (> 15) (Mircioiu and Atkinson, 2017).Мы выбрали тест Краскела – Уоллиса, потому что размер нашей выборки часто меньше 15. Этот тест предполагает равные дисперсии по всем данным. Как показывают Мирчиу и Аткинсон, для многих ситуаций и гомоскедастичность, и нормальность не играют роли, пока размеры выборки (почти) равны (Mircioiu and Atkinson, 2017). И дисперсионный анализ Уэлча (Honjing et al., 2016), и тест Краскела – Уоллиса (Honjing et al., 2016) в некоторой степени устойчивы к выбросам. Мы используем стандартный уровень значимости α = 0,05, поскольку оба наших теста уже корректируют множественные сравнения.

6.2 Количественные данные

Нам пришлось удалить пять вариантов выбора из-за вопросов пользователя или отвлекающих факторов: два для Expand, два для LenSelect Combined и один для IntenSelect. Небольшое количество, 68 из 1500 выборок, было удалено, поскольку их ID не удалось вычислить. Расчет не удался, например, когда конечная точка выбора находилась за пределами видимой области участника.

Сначала мы исследовали время выполнения задачи. Во всех сценах мы обнаружили значимые результаты.Классический RaySelection, обе версии LenSelect и IntenSelect, работали значительно быстрее, чем Expand во всех сценах. В случае аккуратных сцен, таких как «Быстро движущаяся единичная сфера» или «Вращающиеся сферы», IntenSelect работает лучше всего. Например, в Fast Moving Single Sphere апостериорный тест Games-Howell достиг значимости разницы (p <0,001) для IntenSelect по сравнению с RaySelection (-0,688 с, 95% -CI [-0,802 с -0,573 с]) и LenSelectRoot (-0,215 с, 95% -ный доверительный интервал [-0,291 с -0,139 с]). С другой стороны, различные версии LenSelect и RaySelection значительно превосходят IntenSelect в сильно загроможденных сценах, таких как Беспорядок в банках или Сценарий вращающихся банок, когда дело доходит до времени выбора.Например, для сценария вращающихся банок мы измерили значимость (p <0,001) для LenSelect в сочетании с апостериорным тестом Games-Howell по сравнению с IntenSelect (0,668s, 95% -CI [0,411s 0,925s]). В сильно загроможденных сценах, таких как Загроможденные банки, RaySelection, LenSelect и IntenSelect работали одинаково в отношении времени выделения. На рисунке 7 показаны результаты для всех сценариев. Заинтересованный читатель дополнительно найдет все результаты нашего статистического анализа с использованием однофакторных тестов ANOVA и апостериорного анализа Games-Howell в приложении (дополнительная таблица S1).

РИСУНОК 7 . Среднее время для одного выбора для каждого метода отбора. Как можно видеть, LenSelect дает лучшее время выделения, чем IntenSelect, и немного лучшее время, чем RaySelection. Усы показывают интервал в одно стандартное отклонение.

Помимо времени простого выбора, важно, чтобы пользователь действительно выбрал правильный объект. Следовательно, мы также исследовали частоту ошибок для отдельных сценариев. На рисунке 8 представлен обзор средних ошибок, допущенных при использовании различных методов отбора.В частности, для слегка загроможденных статических сцен мы обнаружили очень небольшие ошибки для всех методов выделения. Средняя ошибка была <0,06, медиана была равна 0, а стандартное отклонение <0,3 ошибок. В аккуратных динамических сценах, то есть вращающихся сферах и быстрых сферах, IntenSelect работает значительно лучше, чем другие методы выделения. Например, в сценарии Fast Spheres мы измерили значительную разницу (p <0,001) для IntenSelect по сравнению с RaySelection (-0.86, 95% -CI [-1,00 -0,715]) и LenSelect Combined (-0,32, 95% -CI [-0,420 -0,219]). Однако LenSelect Combined также дает значительно (p <0,001) меньше ошибок, чем RaySelection (-0,54, 95% -CI [-0,714 -0,365]). В сильно загроможденных сценах, статических или динамических, таких как Загроможденные банки и Вращающиеся банки, обе версии LenSelect превосходят другие методы. Например, в сцене «Вращающиеся банки» LenSelect выдает значительно меньше ошибок (p <0,001), чем IntenSelect (0,119, 95% -CI [0,316 0.788]) в соответствии с апостериорным тестом Геймса-Хауэлла.

РИСУНОК 8 . Средние ошибки для каждого метода выбора. Усы показывают интервал 1 стандартного отклонения.

На рисунке 9 представлен обзор среднего эффективного индекса сложности для каждого метода выбора и тестовой сцены. Поскольку все методы выбора изменяют идентификатор (кроме RaySelection, очевидно), мы также исследовали влияние физического идентификатора на время выбора (см. Рисунок 10), где мы поместили линию во все образцы, где можно было вычислить физический индекс сложности. .В целом, LenSelect Combined лучше всех показывает физический индекс сложности, за исключением очень низких ID (то есть легких целей), где лучше всего работает стандартный RaySelect.

РИСУНОК 9 . Средний эффективный индекс сложности для каждой техники выбора. Усы показывают интервал 1 стандартного отклонения.

РИСУНОК 10 . Взаимосвязь между временем завершения задачи (время выбора) и физическим идентификатором цели, который является идентификатором целей в случае простого стандартного RaySelection.Время выбора было усреднено по всем тестовым сценам и всем участникам. LenSelect Combined работает лучше, чем три других метода, за исключением очень низких ID (то есть очень легких целей).

Данные анкеты

В рейтинге сложности анкеты (см. Рисунок 11, слева) тест Краскела – Уоллиса показывает значительный эффект (H (4) = 30,63, p <0,001). Апостериорный тест Тьюки показывает, что Expand (M = 3,35, SD = 1,14) оценивается значительно хуже, чем все другие методы отбора.IntenSelect (M = 2,45, SD = 1,15) оценивается значительно хуже, чем RaySelection (M = 1,5, SD = 0,83). RaySelection был оценен как наименее сложный, за ним последовали LenSelect Combined (M = 1,70, SD = 0,73), а затем LenSelect Root (M = 1,95, SD = 0,83).

РИСУНОК 11 . Слева: средняя оценка участников по факторам «веселье», «сложность» и общий балл из анкеты QUESI. Более высокие значения лучше по 5-балльной шкале Лайкерта. (Результаты для сложности были инвертированы, поэтому более высокое значение здесь означает меньшую сложность.) Справа: средний рейтинг популярности пользователя. Самая популярная техника получила пять баллов, вторая по популярности — 4 и так далее. Усы показывают одно стандартное происхождение.

Рейтинг по гедонистический пользовательский опыт также показывает значительный эффект (H (4) = 14,70, p <0,05). Expand (M = 1,60, SD = 1,31) работает значительно хуже, чем RaySelection (M = 3,95, SD = 0,94), LenSelect Root (M = 3,80, SD = 0,89), IntenSelect (M = 3,70, SD = 1,45) и LenSelect Combined (M = 3,95, SD = 0,76). Остальные кажутся одинаково хорошими по сравнению друг с другом.

Также имеет значение QUESI Total (H (4) = 29,14, p <0,05). RaySelection (M = 4,41, SD = 0,42) работает значительно лучше, чем IntenSelect (M = 3,64, SD = 1,0) и Expand (M = 3,22, SD = 0,86). В то время как Expand показывает значительно более низкий рейтинг, чем LenSelect Root (M = 4,25, SD = 0,55) и LenSelect Combined (M = 4,22, SD = 0,40). Оба метода LenSelect имеют рейтинг немного ниже, чем RaySelection, но не значительно.

Когда пользователей просили ранжировать методы выбора от наиболее к наименее любимым (см. Рисунок 11, справа), значительный эффект также можно наблюдать в ранжировании пользователей (H (4) = 26.93, р <0,001). Здесь Expand (M = 1,55, SD = 1,05) значительно менее популярен, чем RaySelection (M = 3,40, SD = 1,27), LenSelect Root (M = 3,5, SD = 0,88), IntenSelect (M = 3,05, SD = 1,54) и LenSelect Combined (M = 3,40, SD = 1,35). Остальные техники не показывают таких различий между собой.

7 Обсуждение

Результаты исследования показывают, что ни один метод выбора не работает наилучшим образом во всех сценах и со всеми показателями. Однако есть некоторые общие тенденции.

Согласно субъективному общему удовлетворению пользователей (оценка QUESI), RaySelection получил наивысшую оценку среди всех методов выбора, что в основном связано с его высоким рейтингом в отношении сложности (т.е. пользователи посчитали, что это наименее сложная техника). Однако он работает очень медленно. время выполнения задачи, за исключением простейших сценариев (т.е. очень низкие физические идентификаторы). Кроме того, RaySelection имеет относительно высокий уровень ошибок во многих сценах, особенно с движущимися целями.

Expand работает, с одной стороны, хуже всех остальных методов по сравнению с другими методами. субъективные метрики (т.е. результаты анкеты) и wrt. (объективное) время выбора. С другой стороны, в большинстве случаев он оказался наименее подверженным ошибкам, чего и следовало ожидать.Интересно, что это не всегда приводило к наименьшему количеству ошибок выбора. Причина этого для нас не очевидна, поэтому потребуется дальнейшее расследование.

IntenSelect работал лучше всего, если было небольшое или умеренное перекрытие с другими объектами. В этих сценах этот метод может создать наиболее эффективную целевую область для объектов. В других сценах это приводило к множеству ошибок выбора и большому времени выбора. Кроме того, он был оценен хуже, чем LenSelect и RaySelection по всем субъективным показателям.

LenSelect работает более стабильно, чем все другие методы, по всем сценариям тестирования в отношении времени выбора и ошибок выбора (см. Рисунок 10). Эта стабильная производительность может объяснить, почему оба варианта LenSelect получили преимущество в пользовательском рейтинге.

Также следует отметить, что существует разница между вариантами LenSelect Root и Combined Scaling в определенных сценариях. Похоже, что LenSelect Combined работает лучше, чем LenSelect Root с удаленными объектами, что показано в сцене «Пропановые баки вдали».(Это была причина, по которой мы выбрали LenSelect Combined в нашем последнем исследовании.) Это различие, однако, не так ярко выражено, как могло бы быть, поскольку все другие тестовые сцены находились примерно на таком же расстоянии от пользователя. Согласно нашим исследованиям, на средних и близких расстояниях обе функции масштабирования для LenSelect работают одинаково хорошо. Большинство различий относительно Время выполнения задачи не имеет значения, и даже если оно есть, размер эффекта обычно настолько мал, что сомнительно, заметна ли разница для пользователя.

Наконец, мы думаем, что LenSelect может полностью заменить RaySelection практически во всех случаях использования. LenSelect одинаково хорошо работает в обстоятельствах, когда RaySelection показывает хорошие результаты, и во всех остальных случаях превосходит его во всех других протестированных случаях. Основным преимуществом LenSelect является его постоянство, поскольку он никогда не показывает действительно плохих результатов ни в одной из наших тестовых сцен.

Хотя в исследовании все методы выбора реализованы на центральном процессоре, накладные расходы на производительность для LenSelect были минимальными.Используя тестовую сцену Miscellaneous для сравнения, обе технологии LenSelect смогли комфортно работать со скоростью 60 кадров в секунду без каких-либо изменений в производительности при перемещении курсора и, следовательно, масштабировании объектов. По сравнению с RaySelection, который также работал со скоростью 60 кадров в секунду, накладные расходы на производительность незначительны и должны быть незначительными, когда LenSelect реализован в шейдере.

8 Заключение и дальнейшая работа

Мы представили новую метафору выбора на основе лучей под названием LenSelect, которая реализует своего рода эффект искажения линзы, тем самым динамически увеличивая эффективную ширину цели.LenSelect легко внедрить, и его можно интегрировать в существующие системы виртуальной реальности без особых изменений. Фактически, это может быть реализовано в шейдере, что требует минимальных изменений кода рендеринга.

Кроме того, мы представили методику сравнения методов выбора VR на основе лучей. Наша методология включает набор сцен, охватывающих наиболее важные факторы, влияющие на методы выбора, то есть расстояние, размер и плотность объектов в сцене; он также включает сопроводительную анкету для оценки отзывов пользователей.

Наконец, мы провели исследование пользователей, чтобы сравнить несколько современных методов выбора. Наши результаты показывают, что LenSelect может конкурировать даже с классической селекцией лучей в отношении времени выбора, обеспечивая при этом значительно сниженный коэффициент ошибок до 44%. IntenSelect работает лучше, чем LenSelect в тестовых примерах с удаленными объектами, но имеет проблемы в почти загроможденных динамических сценах. Все одноэтапные методы выбора на основе лучей в нашем исследовании пользователей, то есть RaySelection, LenSelect и IntenSelect, превосходят Expand, в котором используется двухэтапный подход.

В целом, хорошая производительность LenSelect кажется наиболее стабильной среди всех методов отбора, которые мы сравнивали в этом исследовании, во всех наших тестовых сценариях. Он также получил наибольшее признание пользователей.

Подход LenSelect, основанный на эффектах линзы, в целом кажется очень многообещающим, и при дальнейших настройках он может даже превзойти IntenSelect в сценах с большими расстояниями до цели. Для этого LenSelect предлагает множество возможностей для изменения эффекта линзы.

Одной из таких модификаций может быть динамическое изменение порядка корня в масштабировании корня в зависимости от количества объектов внутри линзы (чем больше объектов, тем выше порядок корня).Таким образом, выбор объектов из очень загроможденной среды становится еще проще. Другой вариант — вычислить коэффициент масштабирования для масштабирования с одинаковым размером экрана во время выполнения, но затем использовать его в качестве максимального коэффициента sm в масштабировании корня, что должно улучшить производительность, особенно для удаленных объектов.

Кроме того, производительность в сценах с очень высокой изменчивостью размеров объектов (особенно с крошечными объектами) может быть улучшена. Например, динамическое изменение конкретного эффекта линзы во время выполнения, в зависимости от сценария, может быть вариантом.Общая структура нашей техники LenSelect позволяет легко интегрировать другие эффекты искажения объектива или несколько эффектов линз. Очевидно, что такие изменения не должны нарушать присутствие пользователя в среде VR; например, можно рассмотреть непрерывное смешение нескольких типов линз.

В будущем мы планируем продолжить изучение других методов выбора на основе лучей. Конечно, мы также поощряем других исследователей проводить свои эксперименты с нашей методологией. Для этого мы делаем наши сценарии общедоступными на сайте blindedforreview.

Более того, LenSelect сравнивали только с методами выбора на основе лучей. В особенно загроможденных средах могут оказаться более плодотворными другие подходы, такие как Морская звезда (Wonner et al., 2012) или телепортация (Mendes et al., 2017).

Наконец, мы планируем использовать нашу методологию тестирования, чтобы исследовать влияние устройства ввода и типа дисплея виртуальной реальности на оптимальный метод выбора. Например, мы протестируем более сложные устройства ввода для задач выбора, таких как естественное взаимодействие с отслеживанием рук, и исследуем метафоры выбора для больших проекционных экранов powerwall вместо HMD.

Заявление о доступности данных

Необработанные данные, подтверждающие вывод этой статьи, будут предоставлены авторами без излишних оговорок.

Заявление об этике

Этическая экспертиза и одобрение не требовалось для исследования участников-людей в соответствии с местным законодательством и требованиями организации. Пациенты / участники предоставили письменное информированное согласие на участие в этом исследовании.

Вклад авторов

RW внес свой вклад в разработку методики, статистический анализ и написание статьи.WW внедрила метод (ы), провела исследования пользователей, внесла свой вклад в статистический анализ и написание статьи. GZ придумал начальную идею техники взаимодействия, внес свой вклад в развитие техники и написание статьи. CS внесла свой вклад в разработку методики, статистический анализ, а также в написание статьи и оказала дополнительную помощь.

Конфликт интересов

Авторы заявляют, что исследование проводилось в отсутствие каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

Дополнительные материалы

Дополнительные материалы к этой статье можно найти в Интернете по адресу: https://www.frontiersin.org/articles/10.3389/frvir.2021.684677/full#supplementary-material

Ссылки

Andujar, C. , и Ф. Аргелаге (2006). «Поверхности трения: масштабируемая манипуляция с кастингом лучей для взаимодействия с 2D-графическими интерфейсами», в 12-м семинаре Eurographics. по виртуальным средам (Лиссабон, Португалия: EGVE 200).

Google Scholar

Андухар, К., и Ф. Аргелаге (2007). «Виртуальные планшеты: разделение моторного и визуального пространства для гибкого управления 2D-окнами в виртуальных средах», в IEEE Symp. по пользовательским 3D-интерфейсам (IEEE).

Google Scholar

Аргелаге Ф. и Андухар К. (2008). Улучшение 3D-выделения в Ves за счет расширения целей и принудительного отключения интеллектуальной графики . Берлин, Гейдельберг: Springer).

Аргелагет Ф., Андухар К. и Труба Р. (2008). «Преодоление несоответствия видимости глаза и руки при выборе трехмерного наведения», в Proc.2008 ACM Symp. по программному обеспечению и технологиям виртуальной реальности (Нью-Йорк, Нью-Йорк, США: ACM), 43–46. doi: 10.1145 / 1450579.1450588

CrossRef Полный текст | Google Scholar

Bacim, F., Kopper, R., and Bowman, D. A. (2013). Разработка и оценка 3D-методов выбора на основе прогрессивного уточнения. Внутр. J. Человеко-компьютерный Stud. 71, 785–802. doi: 10.1016 / j.ijhcs.2013.03.003

CrossRef Полный текст | Google Scholar

Бенко, Х., Фейнер, С. (2007). «Выбор баллона: метод нескольких пальцев для точного выбора трехмерных изображений с низким уровнем утомляемости», в IEEE Symp.по пользовательским 3D-интерфейсам (IEEE). doi: 10.1109 / 3DUI.2007.340778

CrossRef Полный текст | Google Scholar

Bowman, D. A., and Hodges, L. F. (1997a). «Оценка методов захвата и управления удаленными объектами в иммерсивных виртуальных средах», в материалах симпозиума 1997 г. по интерактивной трехмерной графике (Нью-Йорк, США: ACM), 35. doi: 10.1145 / 253284.253301

CrossRef Full Text | Google Scholar

Bowman, D. A., Johnson, D. B., and Hodges, L.Ф. (1999). «Тестовая оценка методов взаимодействия с виртуальной средой», в Proc. ACM Symp. по программному обеспечению и технологиям виртуальной реальности (VRST) (Нью-Йорк, Нью-Йорк, США: Ассоциация вычислительной техники), 26–33.

Google Scholar

Bowman, D., Kruijff, E., LaViola, J., and Poupyrev, I. (2004). Пользовательские 3D-интерфейсы: теория и практика . Бостон): Аддисон-Уэсли.

Cashion, J., Wingrave, C., и LaViola, J. J. (2012). Плотный и динамичный 3D-выбор для виртуальных игровых сред. IEEE Trans. Vis. Comput. Графика 18, 634–642. doi: 10.1109 / tvcg.2012.40

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Крибби, Р. А., Фиксенбаум, Л., Кесельман, Х. Дж., И Уилкокс, Р. Р. (2012). Влияние ненормальности на статистику тестов для односторонних независимых групп. Br. J. Math. Стат. Psychol. 65, 56–73. doi: 10.1111 / j.2044-8317.2011.02014.x

PubMed Аннотация | CrossRef Полный текст | Google Scholar

de Araujo e Silva, F.Б. (2015). «Повышение точности и скорости выбора за счет прогрессивного уточнения», доктор философии. защитил диссертацию (Политехнический институт Вирджинии и Государственный университет).

Google Scholar

де Хаан, Г., Гриффит, Э. Дж., Коутек, М., и Пост, Ф. Х. (2006). «Гибридные интерфейсы в Ves: намерение и взаимодействие», в 12-м издании Eurographics Symp. по виртуальным средам, 109–118.

Google Scholar

де Хаан, Г., Коутек, М., и Пост, Ф. (2005). «Intenselect: Использование динамического рейтинга объектов для помощи при выборе трехмерных объектов», в IPT / EGVE , 201–209.doi: 10.2312 / EGVE / IPT˙EGVE2005 / 201-209

CrossRef Полный текст | Google Scholar

Элмквист Н. и Тудоряну М. Э. (2006). «Оценка эффективности методов уменьшения окклюзии для трехмерных виртуальных сред», в материалах симпозиума ACM по программному обеспечению и технологиям виртуальной реальности, 9–18.

Google Scholar

Элмквист Н. и Тудоряну М. Э. (2007). Управление окклюзией в иммерсивных и настольных трехмерных виртуальных средах: теория и оценка. Внутр. J. Виртуальная реальность 6, 21–32.

Google Scholar

Гроссман Т. и Балакришнан Р. (2004). Наведение на тривиальные цели в трехмерной среде. в материалах конференции SIGCHI по человеческому фактору в вычислительных системах, Нью-Йорк, Нью-Йорк, США: ACM, 447–454. doi: 10.1145 / 985692.985749

CrossRef Полный текст | Google Scholar

Гроссман Т. и Балакришнан Р. (2006). Разработка и оценка методов выбора для трехмерных объемных дисплеев.in Proceedings of the 19 Annual ACM Symposium on User Interface Software and Technology, New York, NY, USA: ACM, 3–12. doi: 10.1145 / 1166253.1166257

CrossRef Полный текст | Google Scholar

Хайри А.А., Фелс С., Миллер Г. и Ильич М. (2011). «Выбор движущейся цели в двухмерных графических пользовательских интерфейсах», в Взаимодействие человека и компьютера — INTERACT 2011 . Редакторы П. Кампос, Н. Грэм, Дж. Хорхе, Н. Нуньес, П. Паланке и М. Винклер (Берлин, Гейдельберг: Springer), 141–161.doi: 10.1007 / 978-3-642-23771-3_12

CrossRef Полный текст | Google Scholar

Хоффманн, Э. Р. (1990). Захват движущихся целей: модификация закона Фиттса. Эргономика 34, 211–220. doi: 10.1080 / 0014013

67307

CrossRef Полный текст | Google Scholar

Хорнбек, К., и Герцум, М. (2007). Раскрытие удобства использования меню «рыбий глаз». ACM Trans. Взаимодействие компьютер-humam 14. doi: 10.1145 / 1275511.1275512

CrossRef Полный текст | Google Scholar

Hurtienne, J.и Науманн А. (2010). «Контрольные показатели для интуитивного взаимодействия с мобильными устройствами», в материалах 12-й Международной конференции по взаимодействию человека и компьютера с мобильными устройствами и службами (Нью-Йорк, штат Нью-Йорк, США: ACM Press), MobileHCI’10 401–402. DOI: 10.1145 / 1851600.1851685

Google Scholar

Каббаш П. и Бакстон В. А. С. (1995). «Техника« принца »: закон Фиттса и выбор с использованием курсоров площади», в Proc. конференции SIGCHI «Человеческий фактор в вычислительных системах», 273–279.

Google Scholar

Коппер Р., Бэцим Ф. и Боуман Д. А. (2011). «Быстрый и точный выбор 3D путем прогрессивного уточнения», в Пользовательские интерфейсы 3D , 67–74. doi: 10.1109 / 3DUI.2011.5759219

CrossRef Полный текст | Google Scholar

Коппер Р., Боуман Д. А., Сильва М. Г. и МакМахан Р. П. (2010). Модель моторного поведения человека для задач дистального наведения. Внутр. J. Человеко-компьютерный Stud. 68, 603–615. doi: 10.1016 / j.ijhcs.2010.05.001

CrossRef Полный текст | Google Scholar

Ляо, Х., Ли, Ю., Брукс, Г., и Гордон, (2016). Влияние выбросов и методы адаптации: множественные сравнения уровней ошибок типа I. J. Mod. Приложение. Стат. Meth. 15, 452–471. doi: 10.22237 / jmasm / 1462076520

CrossRef Полный текст | Google Scholar

Лу, Ю., Ю., К., и Ши, Ю. (2020). «Исследование пузырькового механизма для лучей с целью улучшения обнаружения трехмерных целей в виртуальной реальности», конференция IEEE 2020 г. по виртуальной реальности и трехмерным пользовательским интерфейсам (VR) (Нью-Йорк, Нью-Йорк, США: IEEE), 35–43.doi: 10.1109 / VR46266.2020.00021

CrossRef Полный текст | Google Scholar

MacKenzie, I. S. (2013). Примечание о применимости формулы Шеннона для индекса сложности Фиттса. OJAppS 03, 360–368. doi: 10.4236 / ojapps.2013.36046

CrossRef Полный текст | Google Scholar

MacKenzie, I. S., and Buxton, W. (1992). «Распространение закона Фиттса на двумерные задачи», в материалах конференции SIGCHI по человеческим факторам в вычислительных системах. (ACM) (Нью-Йорк, Нью-Йорк, США: ACM Press), 219–226.

Google Scholar

Маккензи, И. С. (1992). Закон Фиттса как инструмент исследования и проектирования во взаимодействии человека и компьютера. Взаимодействие человека и компьютера 7, 91–139. doi: 10.1207 / s15327051hci0701_3

CrossRef Полный текст | Google Scholar

MacKenzie, I. S. (2018). Справочник Wiley по взаимодействию человека с компьютером, Закон Фиттса . (Хобокен, Нью-Джерси: Wiley), 17, 349–370. doi: 10.1002 / 9781118976005

CrossRef Полный текст

Mendes, D., Медейрос, Д., Кордейро, Э., Соуза, М., Феррейра, А., и Хорхе, Дж. (2017). «Драгоценный! Выбор вне досягаемости с использованием итеративного уточнения в Vr », в симпозиуме IEEE 2017 г. по трехмерным пользовательским интерфейсам 3DUI (Нью-Йорк, штат Нью-Йорк, США: IEEE), 237–238. doi: 10.1109 / 3DUI.2017.7893359

CrossRef Полный текст | Google Scholar

Mine, M. R. (1995). «Методы взаимодействия виртуальной среды». Технический отчет (Пенсильвания, Пенсильвания, США: Университет Северной Каролины, факультет компьютерных наук).

Google Scholar

Науманн, А.и Хуртьен Дж. (2010). «Контрольные показатели для интуитивного взаимодействия с мобильными устройствами», в материалах 12-й Международной конференции по взаимодействию человека и компьютера с мобильными устройствами и службами (Нью-Йорк, Нью-Йорк, США: ACM), 401–402. doi: 10.1145 / 1851600.1851685

CrossRef Полный текст | Google Scholar

Olwal, A., Benko, H., and Feiner, S. (2003). «Формы чувств: использование статистической геометрии для выбора объектов в мультимодальной системе дополненной реальности», в Proc. 2-й международный симпозиум IEEE / ACM.о смешанной и дополненной реальности ISMAR ’03 (Нью-Йорк, Нью-Йорк, США: ACM Press), 300–301.

Google Scholar

Olwal, A., and Feiner, S. (2003). Гибкий указатель: техника взаимодействия для дополненной и виртуальной реальности , 81–82.

Пирс, Дж. С., Форсберг, А. С., Конвей, М. Дж., Хонг, С., Зелезник, Р. К., и Майн, М. Р. (1997). «Методы взаимодействия плоскости изображения в трехмерной иммерсивной среде», в Proc. Symp. по интерактивной трехмерной графике I3D ’97 (Нью-Йорк, Нью-Йорк, США: ACM Press), 39 – ff.doi: 10.1145 / 253284.253303

CrossRef Полный текст | Google Scholar

Поупырев И., Вегхорст С., Биллингхорст М. и Итикава Т. (1997). «Платформа и испытательный стенд для изучения методов манипуляции для иммерсивной виртуальной реальности», в материалах симпозиума ACM по программному обеспечению и технологиям виртуальной реальности, 21–28.

Google Scholar

Riege, K., Holtkamper, T., Wesche, G., and Fröhlich, B. (2006). «Луч Bent Pick: расширенная техника наведения для многопользовательского взаимодействия», в Proc.Пользовательские 3D-интерфейсы3DUI ’06 (Нью-Йорк, Нью-Йорк, США), 63–66. doi: 10.1109 / VR.2006.127

CrossRef Полный текст | Google Scholar

Саркар М. и Браун М. Х. (1992). «Графические представления графиков« рыбий глаз »», в материалах конференции SIGCHI по человеческому фактору в вычислительных системах (Нью-Йорк, Нью-Йорк, США: Ассоциация вычислительной техники), 83–91. doi: 10.1145 / 142750.142763

CrossRef Полный текст | Google Scholar

Шумейкер, Г., и Гутвин, К. (2007). «Поддержка многоточечного взаимодействия в визуальных рабочих областях» в Proc.Конференция SIGCHI по человеческому фактору в вычислительных системах CHI ’07 (Нью-Йорк, Нью-Йорк, США: ACM Press), 999–1008. doi: 10.1145 / 1240624.1240777

CrossRef Полный текст | Google Scholar

Shoemaker, G., Tsukitani, T., Kitamura, Y., and Booth, K. S. (2012). Двухкомпонентные модели отражают влияние прироста на производительность прицела. ACM Trans. Comput.-Hum. Взаимодействовать. 19 (1), 34: 1–28: 34. doi: 10.1145 / 2395131.2395135

CrossRef Полный текст | Google Scholar

Стид, А.(2006). На пути к общей модели выбора в виртуальных средах . Нью-Йорк, Нью-Йорк, США: IEEE, 103–110. DOI: 10.1109 / VR.2006.134

CrossRef Полный текст

Тизер, Р. Дж., и Штюрцлингер, В. (2013). «Наведение на трехмерные проекции цели с помощью одноглазых и стереокурсоров», в материалах конференции SIGCHI по человеческому фактору в вычислительных системах (ACM) (Нью-Йорк, Нью-Йорк, США: ACM Press), 159–168.

Google Scholar

Ульрих Д., Дифенбах С.(2010). «Интуи. Изучение аспектов интуитивного взаимодействия », в Mensch & Computer 2010: Interaktive Kulturen . Редакторы Дж. Циглер и А. Шмидт (Мюнхен, Германия: Oldenbourg Wissenschaftsverlag), 251–260. doi: 10.1524 / 9783486853483.251

CrossRef Полный текст | Google Scholar

Vanacken, L., Grossman, T., and Coninx, K. (2007). «Изучение влияния плотности среды и видимости цели на выбор объектов в трехмерных виртуальных средах», в симпозиуме IEEE 2007 г. по пользовательским интерфейсам 3D , 117–124.doi: 10.1109 / 3DUI.2007.340783

CrossRef Полный текст | Google Scholar

Wingrave, C. A., Bowman, D. A., and Hodges, L. F. (2005a). «Базовые факторы для выбора Raycasting», в Proceedings of HCI International.

Google Scholar

Вингрейв, К. А., Боуман, Д. А., и Рамакришнан, Н. (2001). «Первый шаг к интерфейсам, ориентированным на нюансы для виртуальных сред», в Proc. Международная конференция виртуальной реальности, 181–188.

Google Scholar

Wingrave, C.А., Тинтнер, Р., Уокер, Б. Н., Боуман, Д. А., и Ходжес, Л. Ф. (2005b). «Изучение индивидуальных различий в отборе на основе лучей: стратегии и черты» в материалах IEEE Proceedings. VR 2005. Виртуальная реальность, 2005, 163–170.

Google Scholar

Вольф, Д., Гугенхаймер, Дж., Комбош, М., и Рукцио, Э. (2020). «Понимание эффекта Гейзенберга пространственного взаимодействия: ошибка выбора для устройств ввода с пространственным отслеживанием», в материалах конференции CHI 2020 по человеческому фактору в вычислительных системах (Нью-Йорк, Нью-Йорк, США: Ассоциация вычислительной техники), 1–10 .doi: 10.1145 / 3313831.3376876

CrossRef Полный текст | Google Scholar

Воннер, Дж., Грожан, Дж., Капобианко, А., и Бехманн, Д. (2012). «Морская звезда: метод выбора для плотных виртуальных сред», в материалах симпозиума ACM по программному обеспечению и технологиям виртуальной реальности, 101–104.

Google Scholar

Wyss, H.P., Blach, R., and Bues, M. (2006). iSith — Пространственное взаимодействие на основе пересечений для двух рук. В Proc. Пользовательские 3D-интерфейсы. 3DUI ’06 (Нью-Йорк, Нью-Йорк, США: IEEE), 59–61.doi: 10.1109 / VR.2006.93

CrossRef Полный текст | Google Scholar

Zhai, S., Buxton, W., and Milgram, P. (1994). «Шелковый курсор»: исследование прозрачности для захвата трехмерной цели », в Proc. Конференция SIGCHI по человеческому фактору в вычислительных системах CHI ’94 (Нью-Йорк, Нью-Йорк, США), 459–464. doi: 10.1145 / 1.1

CrossRef Полный текст | Google Scholar

Zhai, S., Conversy, S., Beaudouin-Lafon, M., and Guiard, Y. (2003). «Он-лайн реакция человека на расширение цели», в Proc.Конференция по человеческому фактору в компьютерных системах, 177.

Google Scholar

Чжао, Х., Цзинь, X., Шен, Дж., И Лу, С. (2009). Быстрый и надежный выбор мыши с использованием графического оборудования. Внутр. J. Comp. Games Tech. 2009, 1–7. doi: 10.1155 / 2009/730894

CrossRef Полный текст | Google Scholar

может привести к другой классификации его частей.

Рис. 6 (d) показывает, что дальний район реки

классифицируется как статичный, тогда как более близкий район

река классифицируется как имеющий неповторяющееся движение

, а остальная часть региона классифицируется как с повторяющимся движением

.

5 ПРОБЛЕМЫ

Могут быть сцены с очень большими смещениями объектов, где как метод нормального оптического потока

, так и алгоритм LDOF дают менее точные результаты. Хотя сцена может содержать области повторяющегося движения, отличные от

, они могут стать неидентифицируемыми из-за отсутствия

в дискретизированных изображениях. Алгоритм

может дать сбой, например, когда в сцене

есть молния. Это ожидается, поскольку алгоритм оптического потока

работает в предположении постоянной яркости.

Изменение условий освещения в сцене приводит к ошибке сегментации

. Алгоритмы оптического потока

зависят от значения яркости в местоположении

пикселей. Проблемы сегментации возникают в таких исключительных случаях

сложных природных сцен. Использование

неконтролируемого обучения, такого как кластеризация с использованием метода K-средних

, приводит к возникновению проблемы, связанной с разными разделами, приводящими к

в разных кластерах.

6 БУДУЩАЯ РАБОТА

Классификация движения в динамической сцене имеет

светлое исследовательское будущее, когда на сцену влияют

резких изменений освещения.В некоторых из ранее рассмотренных примеров мы видели, что освещение сцены продолжает колебаться, что приводит к

плохим результатам при реализации предложенного алгоритма горифма

(рис. 4). Могут возникнуть проблемы из-за изменений в параметрах камеры, таких как диафрагма, фокусное расстояние

и выдержка. Мы планируем улучшить предложенный подход pro

для использования в синопсисе видео и увеличении движения

в будущем.

7 ВЫВОДЫ

Предлагаемый подход сегментирует сцену на статические,

повторяющиеся и неповторяющиеся области движения, эффективные

для частоты дискретизации от 1 на 30 кадров до 1

на 5 кадров. Для сцен с большим смещением —

единиц LDOF дает лучшие результаты. Подход

не работает в сценах, где условия освещения меняются, поскольку предположение о постоянстве яркости

не выполняется.

Также, когда глубина объекта сильно различается, мы сталкиваемся с трудностями при классификации.Мы надеемся настроить

этот подход на другие приложения компьютерного зрения

, включая сегментацию различных объектов на основе

движения, которое они демонстрируют.

ССЫЛКИ

Блэк, М. Дж. И Анандан, П. (1996). Робастная оценка —

множественных движений: параметрических и кусочно —

гладких полей течения. Computer Vision and Image Un-

derstanding, 63 (1): 75 — 104.

Brox, T. and Malik, J. (2011). Оптический поток с большим смещением

: согласование дескрипторов в вариационной оценке движения

.Анализ шаблонов и машинный интеллект,

IEEE Transactions on, 33 (3): 500–513.

ден Берг, М. В. и Гул, Л. Дж. В. (2012). Стерео в реальном времени

и сегментация видео на основе потоков с суперпикселями.

В WACV, страницы 89–96. IEEE.

Дерпанис, К. Г. и Уайлдс, Р. (2012). Пространственно-временное отображение и распознавание текстуры tex-

на основе анализа временнóй ориентации spa-

. Анализ шаблонов

и машинный интеллект, IEEE Transactions on,

34 (6): 1193–1205.

Хорн, Б. К. и Шунк, Б. Г. (1981). Определение оптического потока

. Искусственный интеллект, 17 (1): 185–203.

Лукас Б. Д. и Канаде Т. (1981). Методика итеративного совмещения изображений

с применением стереозрения

(ijcai). В материалах 7-й международной совместной конференции по искусственному интеллекту (IJ-

CAI ’81), страницы 674–679.

Очс П. и Брокс Т. (2012). Модели движения более высокого порядка

,

и спектральная кластеризация.In Computer Vision and Pat-

tern Recognition (CVPR), 2012 IEEE Conference on,

pages 614–621. IEEE.

Петерсон Б. (2010). Понимание экспозиции: как делать отличные фотографии

любой камерой. Амфото

Книги.

Прич, Ю., Рав-Ача, А., и Пелег, С. (2008). Nonchrono-

логический синопсис видео и индексация. Анализ шаблонов —

sis и Machine Intelligence, IEEE Transactions on,

30 (11): 1971–1984.

Рен, X. и Малик, Дж. (2003). Изучение модели классификации

для сегментации. In Computer Vision, 2003.

Известия. Девятая Международная конференция IEEE

дальше, страницы 10–17, том 1.

Штауфер, К. и Гримсон, У. Е. Л. (1999). Адаптивные модели фоновой смеси

для отслеживания в реальном времени.

В области компьютерного зрения и распознавания образов, 1999.

Конференция компьютерного общества IEEE, том 2.

IEEE.

Вадхва, Н., Рубинштейн, М., Дюран, Ф. и Фриман,

W. T. (2013). Фазовая обработка видео движения.

ACM Trans. График. (Материалы SIGGRAPH 2013),

32 (4).

ДвижениеХарактеристикаДинамическойСцены

707

Социальное содержание и эмоциональная валентность модулируют фиксацию взгляда в динамических сценах

  • 1.

    Лэнд, М. Ф. и Фернальд, Р. Д. Эволюция глаз. Annu. Rev. Neurosci. 15 , 1-29 (1992).

    CAS Статья PubMed Google ученый

  • 2.

    Desimone, R. & Duncan, J. Нейронные механизмы избирательного зрительного внимания. Annu. Rev. Neurosci. 18 , 193–222 (1995).

    CAS Статья PubMed Google ученый

  • 3.

    Адольфс Р. Концептуальные проблемы и направления социальной неврологии. Нейрон 65 , 752–767 (2010).

    CAS Статья PubMed PubMed Central Google ученый

  • 4.

    Бирмингем, Э., Бишоф, У. Ф. и Кингстон, А. Выбор взгляда в сложных социальных сценах. 16 , 341–356 (2008).

    Google ученый

  • 5.

    Ярбус, А. Л. Нет титула . Движение глаз при восприятии сложных объектов (Springer US, 1967).

  • 6.

    Borji, A., Parks, D. и Itti, L. Дополнительные эффекты направления взгляда и ранней заметности в управлении фиксациями во время свободного просмотра. J. Vis. 14 , 3 (2014).

    Артикул PubMed Google ученый

  • 7.

    Coutrot, A. & Guyader, N. Как заметность, лица и звук влияют на взгляд в динамичных социальных сценах. J. Vis. 14 , 1–17 (2014).

    Артикул Google ученый

  • 8.

    Foulsham, T., Cheng, J. T., Tracy, J. L., Henrich, J. & Kingstone, A.Распределение взгляда в динамической ситуации: влияние социального статуса и разговорной речи. Познание 117 , 319–331 (2010).

    Артикул PubMed Google ученый

  • 9.

    Серф М., Фрейди Э. П. и Кох К. Лица и текст привлекают взоры независимо от задачи: экспериментальные данные и компьютерная модель. J. Vis. 9 , 1–15 (2009).

    Артикул PubMed Google ученый

  • 10.

    Росс, Н. М. и Ковлер, Э. Движение глаз при просмотре видео с комментариями, субтитрами и без звука. J. Vis. 13 , 1–19 (2013).

    Артикул PubMed PubMed Central Google ученый

  • 11.

    Tatler, B. W. Центральное смещение фиксации при просмотре сцены: выбор оптимального положения просмотра независимо от моторных смещений и распределения характеристик изображения. J. Vis. 7 (4), 1–17 (2007).

    Артикул PubMed Google ученый

  • 12.

    Ле Мер, О., Ле Калле, П. и Барба, Д. Прогнозирование визуальных фиксаций на видео на основе визуальных характеристик низкого уровня. Vision Res. 47 , 2483–2498 (2007).

    Артикул PubMed Google ученый

  • 13.

    Ценг П., Камерон И. Г. М., Муньос Д. П. и Итти Л. Количественная оценка смещения центра наблюдателей при свободном просмотре динамических природных сцен. J. Vis. 9 , 1–16 (2009).

    Артикул Google ученый

  • 14.

    Кюммерер, М., Уоллис, Т. С. А. и Бетге, М. Сравнение теоретико-информационных моделей объединяет показатели значимости. 1–6, https://doi.org/10.1073/pnas.1510393112 (2015).

  • 15.

    Харел, Дж., Кох, К. и Перона, П. Визуальная выразительность на основе графиков. Adv. Neural Inf. Процесс. Syst . 445–552 (2006).

  • 16.

    Parkhurst, D., Law, K. & Niebur, E. Моделирование роли значимости в распределении открытого визуального внимания. Vision Res. 42 , 107–123 (2002).

    Артикул PubMed Google ученый

  • 17.

    Итти, Л. Количественная оценка вклада низкоуровневой заметности в движения человеческого глаза в динамических сценах. Vis. когн. 12 , 1093–1123 (2005).

    Артикул Google ученый

  • 18.

    Карми Р. и Итти Л. Визуальные причины и корреляты выделения внимания в динамических сценах. Vision Res. 46 , 4333–4345 (2006).

    Артикул PubMed Google ученый

  • 19.

    Итти, Л., Кох, К. и Нибур, Э. Модель визуального внимания на основе значимости для быстрого анализа сцены. Pattern Anal. Мах. Intell. 20 , 1254–1259 (1998).

    Артикул Google ученый

  • 20.

    Шеллер, Э., Геймер, М. и Бюхель, К. Диагностические особенности эмоциональных выражений обрабатываются преимущественно. PLoS One 7 , e41792 (2012).

    ADS CAS Статья PubMed PubMed Central Google ученый

  • 21.

    Бирмингем, Э., Бишоф, У. Ф. и Кингстон, А. Важность не учитывает фиксацию глаз в социальных сценах. Vision Res. 49 , 2992–3000 (2009).

    Артикул PubMed Google ученый

  • 22.

    Энд, А. и Геймер, М. Предпочтительная обработка социальных характеристик и их взаимодействие с физическими особенностями в сложных натуралистических сценах. Фронт. Психол . 8 (2017).

  • 23.

    Франк, М. К., Вул, Э. и Джонсон, С. П. Развитие внимания младенцев к лицам в течение первого года жизни. Познание 110 , 160–170 (2009).

    Артикул PubMed Google ученый

  • 24.

    Серф, М., Харел, Дж., Кох, К. и Эйнхойзер, У. Прогнозирование взгляда человека с использованием низкого уровня заметности в сочетании с распознаванием лиц. Adv. Neural Inf. Процесс. Syst . 241–248, https://doi.org/10.1016/j.visres.2015.04.007 (2008).

  • 25.

    Parks, D., Borji, A. & Itti, L. Модель с расширенной заметностью с использованием автоматического определения позы головы в 3D и наученного взгляда, отслеживающего естественные сцены. Vision Res. 116 , 113–126 (2015).

    Артикул PubMed Google ученый

  • 26.

    Сюй Дж., Ван С. и Канканхалли М. С. Предсказание человеческого взгляда за пределами пикселей. J. Vis. 14 , 1–20 (2014).

    CAS Google ученый

  • 27.

    Kingstone, A. Реальный взгляд на социальное внимание. Curr. Opin. Neurobiol. 19 , 52–56 (2009).

    CAS Статья PubMed Google ученый

  • 28.

    Флетчер-Уотсон, С., Финдли, Дж. М., Ликам, С. Р. и Бенсон, В. Быстрое обнаружение информации о человеке в естественной сцене. Восприятие 37 , 571–584 (2008).

    Артикул PubMed Google ученый

  • 29.

    Митал, П. К., Смит, Т.Дж., Хилл, Р. Л. и Хендерсон, Дж. М. Сгруппирование взгляда во время просмотра динамической сцены предсказывается движением. Cognit. Comput. 3 , 5–24 (2011).

    Артикул Google ученый

  • 30.

    Дорр, М., Гегенфуртнер, К. Р. и Барт, Э. Изменчивость движений глаз при просмотре динамических природных сцен. J. Vis. 10 , 1–17 (2010).

    Артикул Google ученый

  • 31.

    Смит, Т. Дж. И Митал, П. К. Синхронизация внимания и влияние задачи просмотра на поведение взгляда в статических и динамических сценах. J. Vis. 13 , 1–24 (2013).

    Google ученый

  • 32.

    Бирмингем, Э. и Кингстон, А. Социальное внимание человека Новый взгляд на прошлые, настоящие и будущие исследования. 140 , 118–140 (2009).

  • 33.

    Бирмингем, Э., Бишоф, В. Ф.& Kingstone, A. Будьте реальными! Разрешение споров об эквивалентных социальных стимулах. Vis. когн. 17 , 904–924 (2009).

    Артикул Google ученый

  • 34.

    Рихтер, С. Х., Гарнер, Дж. П. и Вюрбель, Х. Стандартизация окружающей среды: лекарство или причина плохой воспроизводимости в экспериментах на животных? Nat. Методы 6 , 257–261 (2009).

    CAS Статья PubMed Google ученый

  • 35.

    Рихтер, С. Х., Гарнер, Дж. П., Ауэр, К., Кунерт, Дж. И Вюрбель, Х. Систематические вариации улучшают воспроизводимость экспериментов на животных. Nat. Методы 7 , 167–168 (2010).

    CAS Статья PubMed Google ученый

  • 36.

    Вюрбель, Х. Поведение и ошибка стандартизации. Nat. Genet. 26 , 263 (2000).

    Артикул PubMed Google ученый

  • 37.

    Оман А., Фликт А. и Эстевес Ф. Внимание привлекает внимание: обнаружение змеи в траве. J. Exp. Psychol. Gen. 130 , 466–478 (2001).

    CAS Статья PubMed Google ученый

  • 38.

    Визер М. Дж., Мактиг Л. М. и Кейл А. Устойчивая преференциальная обработка сигналов социальной угрозы: предвзятость без конкуренции? J. Cogn. Neurosci. 23 , 1973–1986 (2011).

    Артикул PubMed Google ученый

  • 39.

    Йинд, Дж. Влияние эмоций на внимание: обзор обработки вниманием эмоциональной информации. Cogn. Эмот. 24 , 3–47 (2010).

    Артикул Google ученый

  • 40.

    Vuilleumier, P. & Huang, Y. M. Эмоциональное внимание, раскрывающее механизмы аффективных предубеждений в восприятии. Curr. Реж. Psychol. Sci. 18 , 148–152 (2009).

    Артикул Google ученый

  • 41.

    Лэнг, П. Дж., Брэдли, М. М. и Катберт, Б. Н. Международная система аффективных картинок (IAPS): Техническое руководство и аффективные рейтинги. NIMH Cent. Изучите Emot. Привет . 39–58 (1997).

  • 42.

    Брейнард, Д. Х. Набор инструментов психофизики. Spat. Vis. 10 , 433–436 (1997).

    CAS Статья PubMed Google ученый

  • 43.

    Корнелиссен, Ф. В. и Петерс, Э. М. Набор инструментов Eyelink: отслеживание взгляда с помощью MATLAB и набора инструментов Psychophysics. Behav. Res. Методы, приборы, вычисл. 34 , 613–617 (2002).

    Артикул Google ученый

  • 44.

    Брэдли, М. и Лэнг, П. Дж. Измерение эмоций: манекен самооценки и семантический дифференциал. J. Behav. Ther. Exp. Психиатрия 25 , 49–59 (1994).

    CAS Статья PubMed Google ученый

  • 45.

    Рёслер, Л., Энд, А. и Геймер, М. Ориентация на социальные особенности в натуралистических сценах рефлексивна. PLoS One 12 , e0182037 (2017).

    Артикул PubMed PubMed Central Google ученый

  • 46.

    Чиккетти, Д. В. Руководящие принципы, критерии и практические правила для оценки нормированных и стандартизированных инструментов оценки в психологии. Psychol. Оценивать. 6 , 284–290 (1994).

    Артикул Google ученый

  • 47.

    Velden, M. & Wölk, C. Изображение сердечной активности в реальном времени: предложение по стандартизации. J. Psychophysiol. 1 , 173–175 (1987).

    Google ученый

  • 48.

    Nuthmann, A. & Einhäuser, W. Новый подход к моделированию влияния характеристик изображения на выбор фиксации в сценах. Ann. Акад. Sci. 1339 , 82–96 (2015).

    ADS Статья PubMed PubMed Central Google ученый

  • 49.

    Bates, D., Maechler, M., Bolker, B. & Walker, S. В пакете R, версия 1-23 (2014).

  • 50.

    Бирнс, Дж. Э., Стахович, Дж.Дж., Бирнс, Дж. Э. и Стахович, Дж. Дж. Последствия потери разнообразия потребителей: разные ответы из разных экспериментальных дизайнов. Экология 90 , 2879–2888 (2009).

    Артикул PubMed Google ученый

  • 51.

    Кэмерон, А. К., Виндмейер, Ф. А. Г. и Кэмерон, А. К. Меры R-квадрата для моделей регрессии данных подсчета с приложениями к использованию в здравоохранении. J. Автобус. Экон. Стат. 14 , 209–220 (1996).

    Google ученый

  • 52.

    Van Buuren, S. Гибкое вменение недостающих данных . (CRC press, 2012).

  • 53.

    Кортина Дж. М. Что такое коэффициент альфа? Исследование теории и приложений. J. Appl. Psychol. 78 , 98–104 (1993).

    Артикул Google ученый

  • 54.

    Streiner, D. L. Начиная с самого начала: введение в коэффициент альфа и внутреннюю согласованность. J. Pers. Оценивать. 80 , 99–103 (2003).

    Артикул PubMed Google ученый

  • 55.

    Брэдли, М. М., Кодиспоти, М., Катберт, Б. Н. и Лэнг, П. Дж. Эмоции и мотивация I: защитные и аппетитные реакции при обработке изображений. Эмоция 1 , 276–298 (2001).

    CAS Статья PubMed Google ученый

  • 56.

    Крейбиг, С. Д. Активность вегетативной нервной системы при эмоциях: обзор. Biol. Psychol. 84 , 14–41 (2010).

    Google ученый

  • 57.

    Бернат, Э., Патрик, К. Дж., Беннинг, С. Д. и Теллеген, А. Влияние содержания и интенсивности изображения на аффективную физиологическую реакцию. Психофизиология 43 , 93–103 (2006).

    Артикул PubMed PubMed Central Google ученый

  • 58.

    Лэнг, П. Дж., Гринвальд, М. К. К., Брэдли, М. М. и Хэмм, А. Просмотр изображений: аффективные, лицевые, висцеральные и поведенческие реакции. Психофизиология 30 , 261–273 (1993).

    CAS Статья PubMed Google ученый

  • 59.

    Зайонц, Р. Б. Простое воздействие: ворота в подсознательное. Curr. Реж. Psychol. Sci. 10 , 224–228 (2001).

    Артикул Google ученый

  • 60.

    Нюстрем, М. и Холмквист, К. Семантическое переопределение низкоуровневых функций при просмотре изображений — как исходное, так и общее. J. Eye Mov. Res. 2 , 1–11 (2008).

    Google ученый

  • 61.

    Кюммерер, М., Уоллис, Т. С. А. и Бетге, М.Сравнение теоретико-информационных моделей объединяет метрики значимости. Proc. Natl. Акад. Sci . 201510393, https://doi.org/10.1073/pnas.1510393112 (2015).

  • 62.

    Чжао, К. и Кох, К. Изучение карты значимости с использованием фиксированных местоположений в естественных сценах. J. Vis. 11 , 9 (2011).

    Артикул PubMed Google ученый

  • 63.

    Coutrot, A. & Guyader, N. Изучение зависящей от времени основной карты значимости на основе данных отслеживания взгляда в видео. arXiv Prepr. arXiv 702 , 00714 (2017).

    Google ученый

  • 64.

    Borji, A. Повышение визуальных функций снизу вверх и сверху вниз для оценки значимости. Comput. Vis. Распознавание образов. (CVPR) , 2 012 IEEE Conf . 438–445 (2012).

  • 65.

    Гигеренцер, Г. и Брайтон, Х. Homo heuristicus: Почему предвзятые умы делают более точные выводы. Верх. Cogn. Sci. 1 , 107–143 (2009).

    Артикул PubMed Google ученый

  • 66.

    ДеМигель В., Гарлаппи Л. и Уппал Р. Оптимальная диверсификация по сравнению с наивной: насколько неэффективна портфельная стратегия 1 / N? Rev. Financ. Stud. 22 , 1915–1953 (2007).

    Артикул Google ученый

  • 67.

    Castelhano, M. S., Wieth, M. & Henderson, J. M. I. Смотрите то, что вы видите: на движения глаз в реальных сценах влияет воспринимаемое направление взгляда. Atten. Cogn. Syst. Теор. Syst. от междисциплинарного. Viewp. 4840 , 251–262 (2007).

    Google ученый

  • 68.

    Татлер, Б. В., Хейхо, М. М., Лэнд, М. Ф. и Баллард, Д. Х. Управление глазами при естественном зрении: переосмысление значимости. J. Vis. 11 , 1–23 (2011).

    Артикул Google ученый

  • 69.

    Foulsham, T., Уокер, Э. и Кингстон, А. Где, что и когда распределения взгляда в лаборатории и в естественной среде. Vision Res. 51 , 1920–1931 (2011).

    Артикул PubMed Google ученый

  • 70.

    Парсонс, Т. Д. Виртуальная реальность для повышения экологической достоверности и экспериментального контроля в клинической, аффективной и социальной неврологии. Фронт. Гм. Neurosci. 9 , 1–19 (2015).

    Артикул Google ученый

  • 71.

    Кнудсен Э. И. Фундаментальные компоненты внимания. Annu. Rev. Neurosci. 30 , 57–78 (2007).

    CAS Статья PubMed Google ученый

  • 72.

    Бенуцци, Ф. и др. . Обработка социально значимых частей лиц. Brain Res. Бык. 74 , 344–356 (2007).

    Артикул PubMed Google ученый

  • 73.

    Геймер, М. и Бучел, К. Активация миндалины предсказывает взгляд в сторону пугающих глаз. J. Neurosci. 29 , 9123–9126 (2009).

    CAS Статья PubMed Google ученый

  • 74.

    Геймер, М., Шмитц, А. К., Титгемейер, М. и Шильбах, Л. Миндалевидное тело человека рефлекторно ориентируется на черты лица. Curr. Биол. 23 , R917 – R918 (2013).

    CAS Статья PubMed Google ученый

  • 75.

    Могг К., Филиппот П. и Брэдли Б. П. Избирательное внимание к сердитым лицам в клинической социальной фобии. J. Abnorm. Psychol. 113 , 160–165 (2004).

    Артикул PubMed Google ученый

  • 76.

    Зеефельдт, В.Л., Кремер, М., Тушен-Каффье, Б. и Хайнрихс, Н. Журнал поведенческой терапии и сверхбдительности и избегания зрительного внимания у детей с социальной фобией. J. Behav. Ther. Exp. Психиатрия 45 , 105–107 (2014).

    Артикул PubMed Google ученый

  • 77.

    Болл, С., Бартоломеус, М., Питер, У., Лупке, У. и Геймер, М. Журнал тревожных расстройств При социальной фобии механизмы внимания к социальному восприятию смещены. J. Беспокойство. 40 , 83–93 (2016).

    Артикул PubMed PubMed Central Google ученый

  • 78.

    Moukheiber, A. et al. . Поведенческие исследования и терапия Избегание взгляда при социальной фобии: объективная мера и корреляты. Behav. Res. Ther. 48 , 147–151 (2010).

    Артикул PubMed Google ученый

  • 79.

    недель, Дж. У., Хауэлл, А. Н. и Голдин, П. Р. Избегание взгляда при социальном тревожном расстройстве. Депресс. Беспокойство 30 , 749–756 (2013).

    Артикул PubMed Google ученый

  • 80.

    Wang, S. et al. . Атипичная визуальная заметность при расстройстве аутистического спектра, количественно определенная с помощью модельного отслеживания взгляда. Нейрон 88 , 604–616 (2015).

    CAS Статья PubMed PubMed Central Google ученый

  • 81.

    Spezio, M. L., Adolphs, R., Hurley, R. S. E. и Piven, J. Неправильное использование лицевой информации при высокофункциональном аутизме. J. Autism Dev. Disord. 37 , 929–939 (2007).

    Артикул PubMed Google ученый

  • 82.

    Nakano, T. et al. . Атипичные модели взгляда у детей и взрослых с расстройствами аутистического спектра не связаны с изменениями в поведении взгляда, связанными с развитием. Proc.R. Soc. London B Biol. Sci . rspb20100587, https://doi.org/10.1098/rspb.2010.0587 (2010).

  • 83.

    Резерфорд, М. Д. и Таунс, А. М. Различия и сходства путей сканирования во время восприятия эмоций у людей с расстройствами аутистического спектра и без них. J. Autism Dev. Disord. 38 , 1371–1381 (2008).

    CAS Статья PubMed Google ученый

  • 84.

    Nuthmann, A., Einhäuser, W.& Schütz, I. Насколько хорошо модели заметности могут предсказать выбор фиксации в сценах за пределами центрального смещения? Новый подход к оценке моделей с использованием обобщенных линейных смешанных моделей. Фронт. Гм. Neurosci . 11 (2017).

  • MIT-SPARK / Kimera: Индекс репо для Kimera, код

    Kimera — это библиотека C ++ для метрическо-семантической одновременной локализации и отображения в реальном времени, которая использует изображения с камер и инерциальные данные для построения семантически аннотированной трехмерной сетки среды.Kimera имеет модульную структуру, поддерживает ROS и работает на центральном процессоре.

    Kimera состоит из четырех модулей :

    • Быстрый и точный трубопровод визуальной инерциальной одометрии (VIO) (Kimera-VIO)
    • Полная реализация SLAM на основе надежной оптимизации графов поз (Kimera-RPGO)
    • Генератор покадровых и многокадровых трехмерных сеток (Kimera-Mesher)
    • И генератор семантически аннотированных трехмерных сеток (Kimera-Semantics)

    Щелкните следующие ссылки, чтобы установить модули Kimera и приступить к работе! Очень просто установить!

    Кимера-ВИО и Кимера-Мешер

    Кимера-РПГО

    Кимера-Семантика

    Диаграмма

    Цитата

    Если вы нашли какой-либо из вышеперечисленных модулей полезным, мы были бы очень признательны, если бы вы могли процитировать нашу работу:

     @InProceedings {Rosinol19icra-incremental,
      title = {Построение инерциальной визуально-инерционной трехмерной сетки со структурными закономерностями},
      author = {Розинол, Антони и Саттлер, Торстен и Поллефейс, Марк и Карлоне, Лука},
      год = {2019},
      booktitle = {Международная конференция по робототехнике и автоматизации, 2019 г. (ICRA)},
      pdf = {https: // arxiv.org / pdf / 1903.01067.pdf}
    } 
     @InProceedings {Rosinol20icra-Kimera,
      title = {Kimera: библиотека с открытым исходным кодом для метрическо-семантической локализации и сопоставления в реальном времени},
      author = {Розинол, Антони и Абате, Маркус и Чанг, Юн и Карлоне, Лука},
      год = {2020},
      booktitle = {IEEE Intl. Конф. по робототехнике и автоматизации (ICRA)},
      url = {https://github.com/MIT-SPARK/Kimera},
      pdf = {https://arxiv.org/pdf/1910.02490.pdf}
    } 
     @InProceedings {Rosinol20rss-dynamicSceneGraphs,
      title = {{3D} Графики динамических сцен: действенное пространственное восприятие местами, объектами и людьми},
      author = {А.Розинол, А. Гупта, М. Абате, Дж. Ши и Л. Карлоне},
      год = {2020},
      booktitle = {Робототехника: наука и системы (RSS)},
      pdf = {https://arxiv.org/pdf/2002.06289.pdf}
    } 
     @InProceedings {Rosinol21arxiv-Kimera,
      title = {{K} imera: от {SLAM} к пространственному восприятию с {3D} динамическими графиками сцены},
      author = {А. Rosinol, A. Violette, M. Abate, N. Hughes, Y. Chang, J. Shi, A. Gupta, L. Carlone},
      год = {2021},
      booktitle = {arxiv},
      pdf = {https://arxiv.org/pdf/2101.06894.pdf}
    } 

    Наборы данных с открытым исходным кодом

    Помимо реальных тестов на наборе данных Euroc, мы используем фотореалистичный симулятор на основе Unity для тестирования Kimera. В тренажере предусмотрено:

    • Стереокамера RGB
    • Камера глубины
    • Наземная двухмерная семантическая сегментация
    • Данные IMU
    • Одометрия наземной истины
    • 2D Лидар
    • TF (достоверная одометрия роботов и агентов)
    • Static TF (позы истинности статических объектов)

    Используя этот симулятор, мы создали несколько больших визуально-инерциальных наборов данных, в которых представлены сцены с динамическими агентами (людьми) и без них, а также большое разнообразие сред (внутри и снаружи, маленькие и большие).Они идеально подходят для тестирования ваших метрико-семантических SLAM и / или других систем пространственного ИИ!

    Благодарности

    Kimera частично финансируется ARL DCIST, ONR RAIDER, MIT Lincoln Laboratory и Фонд «Ла Кайша» (ID 100010434), LCF / BQ / AA18 / 11680088 (A. Rosinol).

    Лицензия

    Лицензия BSD

    Представления динамических сцен и автономная робототехника

    Страница из

    НАПЕЧАТАНО ИЗ ОНЛАЙН-СТИПЕНДИИ ОКСФОРДА (Oxford.universitypressscholarship.com). (c) Авторские права Oxford University Press, 2021. Все права защищены. Отдельный пользователь может распечатать одну главу монографии в формате PDF в OSO для личного использования. дата: 08 сентября 2021 г.

    Глава:
    (стр.227) 9 Динамические представления сцен и автономная робототехника
    Источник:
    Динамическое мышление
    Автор (ы):

    Стефан К. У. Зибнер

    Кристиан Фобель

    Издатель:
    Oxford University Press

    DOI: 10.1093 / acprof: oso / 9780199300563.003.0009

    Биологические и роботизированные агенты воспринимают и действуют на основе сенсорной информации. Их действия (или действия других агентов) могут повлиять на окружающую среду, что может повлиять на будущие действия. Агентам также необходимо иметь дело с возмущениями и шумом и гибко реагировать на изменения в окружающей среде, которые имеют решающее значение для целей агента. В этой главе обсуждаются вопросы, возникающие в результате воплощения агентов и встраивания всей когнитивной обработки в сенсорные и моторные процессы.Представлена ​​архитектура представления сцены для робота-агента, которая связывает зашумленный и сильно изменчивый вход датчика с инвариантным взгляду аллоцентрическим представлением сцены. Цикл восприятие-действие замыкается путем связывания архитектуры динамического поля с двигателями. Все темы обсуждаются в контексте поведения при исследовании сцены, поддержании рабочей памяти этой сцены и запросе представления для генерации изменения взгляда на целевой объект.

    Ключевые слова: биологический агент, роботизированный агент, аллоцентрическое представление, воплощенное познание, цель, возмущение окружающей среды

    Для получения доступа к полному тексту книг в рамках службы для получения стипендии

    Oxford Online требуется подписка или покупка.Однако публичные пользователи могут свободно искать на сайте и просматривать аннотации и ключевые слова для каждой книги и главы.

    Пожалуйста, подпишитесь или войдите для доступа к полному тексту.

    Если вы считаете, что у вас должен быть доступ к этому заголовку, обратитесь к своему библиотекарю.

    Для устранения неполадок, пожалуйста, проверьте наш FAQs , и если вы не можете найти там ответ, пожалуйста связаться с нами .

    Philips Hue Ambience and Dynamic Experience • hueDynamic для Philips Hue

    С тех пор, как мы получили наш первый стартовый пакет Philips Hue, мы были в восторге от удивительных эффектов и настроения, которые свет мог создать в нашем доме. Однако параметры, предоставляемые официальным приложением Philips Hue, на самом деле не воздают должного свету, особенно в отношении динамических сцен или впечатлений. Мало того, не было достойных и стабильных приложений Philips Hue для Windows, Xbox One или Windows Mobile.

    Мы долго и упорно думали и придумали концепцию hueDynamic, приложения , которое поднимет ваш опыт Philips Hue на новый уровень . Первоначально фокусируясь на динамическом освещении со стереозвуком , мы хотели, чтобы вышел за рамки статических сцен , чтобы действительно дать вам полное погружение. Хотите ли вы зажечь его светом Hue в ванной, отправиться в путешествие к итальянским озерам или прижаться к горящему камину, у hueDynamic есть опыт для вас.

    Ознакомьтесь с демонстрационным видео

    Это короткая видеодемонстрация трех предустановок hueDynamic — камин, спокойное море, огонь и лед . Это лишь небольшая часть из множества , созданных профессионалами, которые предлагает hueDynamic.

    Расширенная поддержка групп и помещений

    hueDynamic позволяет создавать любую группу источников света и даже включать один и тот же источник света в несколько групп (что не поддерживается официальным приложением Philips Hue).Вы можете запускать разные интерфейсы и среды в каждой из ваших групп одновременно из одного и того же экземпляра приложения. В приложении есть удобная страница «состояния», позволяющая регулировать яркость и управлять освещением из одного удобного места в приложении.

    Галерея опыта

    Галерея впечатлений обеспечивает легкий доступ к динамическим предустановкам в приложении. Вы также можете отрегулировать громкость звуков, изменить яркость динамических эффектов и даже ускорить или замедлить их .Все это достигается с помощью простых ползунков, к которым можно быстро получить доступ. Не копаться в меню!

    hueDynamic предлагает потрясающие возможности динамического освещения со стереозвуком.

    Список опыта

    Текущие, полностью динамические, hueDynamic впечатления следующие:

    • Mountain Chill
    • Восход
    • Спокойное море
    • Симулятор солнечного света (в зависимости от вашего местоположения)
    • Вулкан
    • Аврора
    • Пляж
    • Шелковый водопад
    • Буря молний
    • Доктор Хюэ (для любителей научной фантастики, путешествующих во времени!)
    • Красное летнее небо
    • Тибетский храм
    • Камин
    • Свечи
    • Газовое пламя
    • Облачные лучи
    • Тропический лес
    • Падающие листья
    • Ночь в джунглях
    • Двойная радуга
    • Аквариум
    • Пламя и лед
    • Red Alert!
    • Новогодняя елка
    • Санта
    • Сказочные огни
    • Бубенцы
    • Elf Launch!
    • Итальянские озера
    • Летний луг
    • Мальдивы
    • Шарм Найт
    • Триколор
    • Маяк
    • Золотые ворота
    • Пляжная вечеринка
    • Сумерки
    • Множество атмосфер для Хэллоуина и звуковые эффекты
    • Два продвинутых режима дискотеки «От звука к свету»!
    • Динамический режим «Синхронизация камеры» — изменение индикаторов на основе снимка экрана, веб-камеры или камеры телефона

    Список окружения

    Мы также предоставляем предустановленные атмосферы, которые представляют собой смешиваемых сцен , позволяющих вам переключать цвета предустановки между разными источниками света в комнате одним касанием!

    • Стандартный
    • Галоген
    • Флуоресцентный
    • Дневной свет
    • Ночник
    • Эдисон
    • Черный свет
    • Бангкок Отель
    • Осенние листья
    • Полнолуние
    • Банф
    • Берлин
    • Павлин
    • Лыжи
    • Страна чудес
    • Гавайи Закат
    • Лес
    • Коралл
    • Праздник
    • 4 июля
    • Релакс
    • Читать
    • Концентрат
    • Энергия
    • Большой выбор цветовых предустановок
    • Индивидуальные фото-окружения с использованием нашей технологии OmniScene — создавайте свои собственные, из ваших любимых фотографий, но цвета можно смешивать с вашими источниками одним касанием!

    Фотообои хранятся на мосту Hue, то есть вы можете получить к ним доступ с любого устройства, на котором работает hueDynamic.

    Станьте первым комментатором

      Добавить комментарий

      Ваш адрес email не будет опубликован. Обязательные поля помечены *