013670 Уровень техники устройству согласно родовому понятию п.7 формулы изобретения.

advertisement
013670
Уровень техники
Изобретение относится к способу согласно родовому понятию п.1 формулы изобретения, а также к
устройству согласно родовому понятию п.7 формулы изобретения.
В области стереофонической дистанционной передачи звуковых событий известны стереофонически спроектированные полнодуплексные маршруты передачи в реальном времени высокого качества в
области радиовещательной техники и технике студийной записи, которые, однако, привязаны к стационарным сетевым пунктам передачи. Кроме того, известны стереофонические беспроводные двухточечные соединения ближнего действия соответственно высокого качества, которые главным образом используются для радиопередачи интервью во внешней среде.
В области телефонных вызовов конференц-связи, с другой стороны, уже известно много предложений для стереофонического приема, передачи и воспроизведения телефонных сигналов, для лучшей
идентификации соответствующего(их) участника(ов) диалога или для улучшения разборчивости речи
или в любом случае по типу панорамного микширования позиционировать соответственно монофонически принимаемые отдельные источники (говорящих участников) в определенное место в стереопанораме.
Ни современные технологии стереофонической передачи в области радиовещания и студийной записи, ни существующие предложения для стереофонического конфигурирования схем конференц-связи
не относятся к основной идее настоящего изобретения - мобильной передачи персональных акустических изображений в режиме реального времени, потому что эта область является новой по самой постановке задачи.
Однако в ближайшем, в некотором роде сопоставимом уровне техники можно сослаться в качестве
примера на следующие публикации: WO 98/42161 А2, US 4088849 А, ЕР 0724352 А2, DE 4041319 А1,
ЕР 0358028 А2, JP 02217100 АА, DE 10020857 A1, JP 06268722 AA, DE 3737873 С2.
Согласно WO 98/42161 А2 телефонная передача трехмерного звукового события происходит таким
образом, что перед участником(ами) - в соединении с персональным компьютером - размещены стационарно два микрофона на расстоянии друг от друга, причем расстояние соответствует приблизительно
ширине головы человека. Предпочтительно микрофоны размещены в искусственных формах уха, поскольку вся конфигурация должна напоминать искусственную голову или, по меньшей мере, соответствовать принципу так называемой стереофонии разделенных устройств (термин, относящийся к методам
стереофонического приема звука, который использует два микрофона, разделенных акустически непрозрачным объектом с размерами головы). Для воспроизведения стереофонических сигналов, принимаемых таким способом от соответствующей противоположной стороны, предусмотрены также расположенные на расстоянии по обе стороны громкоговорители, таким образом завершающие конфигурацию.
Кроме того, применяется множество специальных схем для фильтрации, сжатия, прореживания данных
и, возможно, также используется перекрестная компенсация, в особенности, чтобы компенсировать специальные искажения, которые возникают, когда сигнал сначала принимается структурой типа "искусственной головы" или микрофонной конфигурацией разделенных устройств и затем поступает через громкоговорители к соответствующему слушателю.
Устройство согласно WO 98/42161 А2 в принципе можно рассматривать как нейтральное к пользователю. Оно не настроено, таким образом, на субъективную персону, на что направлено настоящее изобретение, как это объясняется подробно в нижеследующем описании, которое передает относящееся к
отдельному участнику разговора его субъективное, таким образом, прослушиваемое изображение в соответствии с изменяющейся акустической окружающей средой, как она относится к данному участнику
разговора. Напротив, в WO 98/42161 А2 акустическая окружающая среда всегда передается из постоянно
остающейся той же самой перспективы, которая принимается или "обнаруживается" жестко установленной искусственной головой. По этой причине данное известное устройство ведет себя нейтрально по отношению ко всем лицам, участвующим в акустическом событии. Эта ситуация может быть желательной
для конференции, так как она разрешает каждому отдельному участнику находиться в различном положении и, таким образом, при восприятии окружающей среды искусственной головы обеспечивает возможность легкой идентификации каждого говорящего лица при условии, что во время разговора никто
не перемещается. WO 98/42161 А2 также упоминает возможность использования наушников для воспроизведения входящих конференц-вызовов в качестве только вспомогательных средств, которые могут дополнительно улучшить воспринимаемое местоположение отдельных участников происходящей конференции. Одновременно в группе слушающих участников в одном и том же помещении их внутренняя
коммуникация затрудняется.
С точки зрения основной концепции настоящего изобретения и его назначения, которое оно выполняет, предлагаемое изобретение уходит от конфигурации, раскрытой в WO 98/42161 А2, в нескольких
аспектах и фактически следует в противоположном направлении:
1) персональная перспектива, которая является основой настоящего изобретения с типичными для
нее движениями головы и тела, не принимает во внимание стабильное и надежное позиционирование
любого участника разговора в пределах окружающей среды, которая обнаруживается;
2) на стороне воспроизведения голос фактического носителя устройства, основанного на настоящем
изобретении, как воспринимается его аппаратурой и воспроизводится участнику разговора в другом ме-1-
013670
стоположении, воспринимался бы вне потенциальной группы, ведущей разговор, собравшейся вокруг
передатчика, а именно он воспринимался бы вблизи или в пределах головы удаленного участника ("локализация в голове").
Оба условия противоречат цели WO 98/42161 А2: обеспечить стабильное и предсказуемое пространственное распределение отдельных участников конференции, собравшихся вокруг стола, из перспективы удаленного третьего лица, который физически не присутствует при разговоре. Кроме того,
3) носимая при себе конфигурация технических средств с батарейным питанием согласно признакам настоящего изобретения не только была бы ненужной для цели WO 98/42161 А2, но даже противоречила
бы его назначению или нарушала его, поскольку последнее должно определять пространственное распределение стационарного разговора в процессе работы фиксированной телекоммуникационной системы, установленной в помещении конференции.
Чтобы при бинауральной записи, особенно в наружной среде, не требовать обязательного использования традиционной конфигурации искусственной головы, в US 4088849 А используется голова самого
лица, осуществляющего запись, при этом вне контролирующих головных наушников, носимых им, причем левый и правый головные наушники связаны друг с другом обычной эластичной скобой, сформированы искусственные формы моделирования уха, которые содержат микрофоны. Сигналы записи подаются в магнитофон и воспроизводятся через головные наушники немедленно после этого для одновременного контроля записываемых звуковых событий. Таким образом, носитель является своей собственной
"искусственной головой" с внешними моделированными ушами. В указанном документе нет сведений об
удаленной передаче сигналов.
Другая возможность для идентификации участников телефонного конференц-вызова, при которой
не учитывается стереофоническая передача сигнала, показана в ЕР 0724352 А2. Цифровое телекоммуникационное устройство коммутации переключения содержит блок таблиц с данными идентификации всех
участников. Тот, кто говорит громче всех, автоматически переключается, и соответствующая идентификация включается в устройствах других участников, чтобы указать на говорящее лицо.
В другом контексте, а именно в области систем видео- и аудиокоммуникации, которые используются, например, для дистанционного обучения через спутники, известно само по себе переключение микрофона, приводимое в действие произвольным образом, DE 4041319 А1.
Чтобы улучшить распознавание голоса при стереофонической удаленной передаче звуковых событий, также известно (JP 02217100 АА) обеспечение дополнительного среднего опорного микрофона для
подмешивания голоса, когда голос говорящего превышает заданное пороговое значение (см. реферат).
Для улучшения качества идентификации участников разговора можно сослаться на возможность
моделирования стереофонической передачи (DE 3737873 С2) путем обработки бинауральных сигналов,
предоставляемых слушателю через головные телефоны или наушники со специальными фильтрами (например, фильтрами высоких частот, фильтрами нижних частот, линиями задержки, всечастотными
фильтрами и т.п.), чтобы добавить информацию расстояния и особенно информацию направления (что
известно как бинауральное направленное микширование). За счет этого и путем настройки фильтров соответственно входящим вызовам от различных участников разговора голоса могут быть сопоставлены с
различными направлениями прослушивания, что может существенно улучшить разборчивость одновременно приходящих голосов различных участников разговора, например, в шумной окружающей среде.
Таким образом, такие (виртуально) "стереофонические" телефонные соединения направлены на моделирование общего "стереофонического пространства", чтобы позиционировать мобильных участников разговора или участников конференц-вызова, с намерением селективно сопоставить различные направления
с одновременно поступающими голосами индивидуальных участников конференции.
DE 10020857 А1 ссылается на подобное направление применения стереофонического моделирования, хотя в этом случае для мобильного телекоммуникационного блока с пишущим микроплеером, который, проще говоря, является сотовым телефоном с МР3-плеером. В нем обеспечены, как обычно для высококачественного стереофонического восприятия музыки, головной телефон или наушники. Кроме того, по меньшей мере один, предпочтительно несколько микрофонов размещены в так называемом "головном/ушном устройстве генерации звука/крепления", в частности так называемой головной гарнитуре.
Головная гарнитура отделена от блока мобильного телефона и имеет беспроводное соединение. Именно
это беспроводное соединение обеспечивает необходимое стереофоническое/двухканальное аналогоцифровое и цифроаналоговое преобразование для каждого направления передачи (см. столбец 2, строки
20-30 или 39-41). Эти объяснения относятся, очевидно, только к хорошо знакомым в мобильных телефонах так называемым "Bluetooth'' - беспроводным соединениям между собственно устройством и головным телефоном и микрофоном в головной гарнитуре. В DE 10020857 А1 подчеркивается в качестве особенно существенного усовершенствования в таких мобильных телефонных блоках с МР3-плеерами комбинация такого МР3 сотового телефона с электромагнитными средствами экранирования, чтобы контролировать биологические эффекты напряжения, вызванными избыточными напряженностями поля (столбец 1, строки 35-46). С этой целью предложено разместить природный кварцевый песок или розовый
кварц в продолговатые медные/пластиковые трубки, помещенные в системе трубок из слоистого железного/медного листового материала, за счет чего уменьшается реакция тела на эффекты напряжения или
-2-
013670
реакции на "электро-смог" (столбец 1, строки 47-54).
DE 10020857 А часто не дает однозначных указаний относительно технического действия с желательной и необходимой ясностью, но в любом случае в этой публикации не предусматриваются меры,
необходимые для действительно стереофонической телекоммуникационной передачи; и только рассматривается упомянутая передача Bluetooth между мобильным телефонным устройством и гарнитурой для
приема речи и прослушивания, связанной с ним. Это становится ясным, например, из ссылки в столбце 2,
строки 54-59, согласно которой различные речевые/аудиосигналы, воспроизводимые пользователю/слушателю, могут индивидуально микшироваться и бинаурально фильтроваться по направлению для
их избирательного введения в такие сигналы в различных направлениях прослушивания. Эта направленная фильтрация соответствует ранее упомянутым фильтрам верхних/нижних частот и подобным фильтрам для произвольной настройки назначенных направлений источников прослушивания согласно
DE 3737873 С2, в то время как при реальном приеме "вживую" стереофонической панорамы произвольное позиционирование по направлению воспроизводимых источников звука не предусматривается и не
возможно.
В JP 06268722 АА описана схема мультиплексного приемника, который разделяет входной сигнал,
полученный через телефонную линию, на левый и правый сигнал громкоговорителя и обрабатывает их
соответственно, особенно для абонентов, которые принимают по телефонному соединению высококачественные музыкальные произведения.
Наконец, в ЕР 0358028 А2 раскрыто цифровое телекоммуникационное устройство переключения с
мультиплексированием по времени с использованием голосовой памяти, которая может быть использована как память конференции и расширена дополнительными ячейками памяти. При этом контур обратной связи соединяет выход голосовой памяти с ее входом. Стереофонические аспекты не учитываются.
Настоящее изобретение направлено на выполнение задачи обеспечения возможности передачи, в
особенности мобильной передачи, персональных трехмерных прослушиваемых изображений в реальном
времени посредством стереофонической телефонии, приспособленной для данной задачи и по данному
назначению, как это необходимо.
Изобретение решает эту задачу отличительными признаками основного пункта, или п.1, на устройство и, таким образом, устанавливает новую область: передача персональных прослушиваемых изображений в режиме реального времени.
Посредством бинаурального захвата или бинаурального приема звука в области уха каждого участника разговора получаются естественные, связанные с головой прослушиваемые изображения в качестве
подлежащей передаче стереопанорамы, которая соответствует реальной действительности в самом большом приближении. Каждый участник через свой соответствующий головной телефон или наушники
воспринимает окружающую среду, в которой его партнер по разговору находится в текущее время, по
отношению к голове этого партнера, включая голос этого партнера, как он слышится в его окружающей
среде и только в этой окружающей среде и, таким образом, со всеми отражениями, дифракциями и резонансами, формируемыми в пределах той окружающей среды или под ее влиянием. Это также является
основным фактором в обеспечении хорошей разборчивости речи, так как создаются точные обстоятельства, к которым вообще приучены и адаптированы обрабатывающие голос отделы головного мозга каждого человека с начала эволюции языка, а именно воспринимать полный звук голоса с определенным
спектром резонансов, дифракций и отражений, формируемых в пределах конкретной окружающей среды
относительно собственного тела слушателя, а не урезанный спектр узкого и практически "мертвого" звука имевших место до настоящего времени телефонных голосовых передач.
К этому относится другое явление, которое состоит в том, что с помощью средств изобретения также удается эффективно подавлять восприятие мешающих шумов, потому что такие шумы могут хорошо
определяться по местоположению слушающим участником и поэтому могут быть отселектированы априорно как не относящиеся к разговору. Это также является специальной способностью человеческого
уха и мозга - и, по-видимому, не только человеческого уха или мозга - и проявляется фактически очень
хорошо в так называемом "эффекте вечеринки с коктейлем", который часто упоминается в этом контексте: несмотря на смесь шумов, складывающуюся из перекрытия множества голосов, приходящих с различных расстояний и направлений, присутствующие практически без проблем в состоянии различить
отдельных говорящих даже с некоторого расстояния и сконцентрироваться на тех, кто их интересует.
Восприятие всех других звуковых событий той же громкости и даже более громких звуковых событий бессознательно подавляется или ослабляется до уровня, который больше не препятствует пониманию. Используя это естественное явление, изобретение обеспечивает возможность, за счет реализации
связанного с головой участника бинаурального восприятия акустической среды, также в ситуациях конференции любого вида, по существу, естественного разговора при немедленной ориентации на любого
конкретного партнера по разговору.
Для лучшего понимания именно этого аспекта изобретения нужно указать на то, что посредством
высококачественной бинауральной передачи участник разговора в другом конце телефонного соединения может воспринимать собственное местное акустическое окружение исходя из собственной, связанной с данным человеком перспективы, со всеми ее воспринимаемыми звуковыми оттенками, последова-3-
013670
тельностями тонов и иными пространственными признаками, как часть "акустического театра", находится ли человек в нью-йоркском джаз-клубе, на карнавале в Рио или на берегу, где слышен шум прибоя и
крики чаек.
К этому аспекту также относится возможность добавления или подмешивания других звуков или
последовательностей тонов в передаваемый бинауральный стереосигнал, который содержит местные
события звуков и разговора, например несколько ослабленную по своей динамике, не создающую помех
музыку, песни или иное из того, что сохранено в мобильном телефоне или в специальном цифровом аудиоплеере, который непосредственно используют для разговора. Если необходимо избежать обычно возникающей "локализации в голове" добавленных обычных аудиосигналов, можно для этой цели предусмотреть бинауральное направленное кодирование. Интеграция таких разнообразных функций, как телефон, МР3-плеер, компьютер, игровая приставка и т.п. в единственном маленьком устройстве, представляет современный уровень техники и может, разумеется, быть частью любого выбранного варианта
осуществления изобретении.
Несмотря на относительно высокие требования, предъявляемые широкополосным бинауральным
полнодуплексным соединением, работающим в режиме реального времени, к проводной или беспроводной передаче данных - независимо от того, осуществляется ли она через сетевые структуры с коммутацией каналов или с коммутацией пакетов, - качество передачи, адекватное цели изобретения, может быть
достигнуто, при имеющихся в настоящее время полосах пропускания сети и качестве обслуживания, посредством соответствующего выбора из имеющихся в настоящее время схем кодирования и декодирования сигнала и канала и их возможных реализаций. Также упомянутые выше высококачественные соединения связи в области радиовещания и студийной техники, которые реализуются через широкополосные
проводные сетевые структуры и через беспроводные двухточечные соединения или при помощи процессов связывания каналов в сетях сотовой телефонной связи, являются чрезвычайно развитыми примерами,
показывающими, что существуют технические предпосылки для реализации бинауральной связи в смысле настоящего изобретения. Так называемая Интернет-телефония, которая обычно известна как VoIP
(протокол "голос через Интернет"), является специальным приложением ранее упомянутых сетевых
структур с коммутацией пакетов, которые могут использоваться в соединении с существующими интерфейсами радиосвязи, такими как WiMax или его потенциальные преемники, такие как HiperLAN/2, как
часть вышеупомянутых структур и процессов, которые являются подходящими для предусматриваемой
бинауральной коммуникации в реальном времени.
Особые преимущества, которые значительно увеличивают или используют возможности настоящего изобретения, проявляются в особенности ввиду персональной мобильности, обеспеченной мерами,
предусмотренными в зависимом п.2 формулы изобретения, через передачу персональных прослушиваемых изображений в реальном времени, которые распространяются в их мобильной и связанной с человеком конфигурации на все разнообразие реальных ситуаций, вместо того, чтобы быть ограниченными
локальной средой соединения стационарной линии или, в случае локального беспроводного соединения,
очень узкой областью приема такого соединения.
Именно такую мобильную телефонию можно понимать в известном смысле как основную или во
всяком случае самую широкую область применения бинауральной стереофонии. Обе эти технологии так
сказать созданы друг для друга как с точки зрения их технической конфигурации, так и с точки зрения их
практического использования, что до сих пор и после их зарождения нигде открыто не было признано.
Через интеграцию мобильного дуплексного соединения в реальном времени с бинауральной технологией
передачи в настоящее время все более отчетливо проявляющийся принцип так называемого удаленного
присутствия или удаленного переноса может быть осуществлен с высокой эффективностью в акустической области.
В отношении конкретной области технологии конференц-вызова, которая, однако, не представляет
основную область или главное применение заявленного изобретения, изобретение имеет преимущество,
заключающееся в том, что впервые оба или - в случае так называемых конференц-вызовов (независимо
от того, направлены ли они от нескольких участников в одном и том же помещении к одному или нескольким участникам, расположенным в другом месте, или они исходят из нескольких местоположений)
- всем участникам обеспечена возможность вести разговоры с любым участником, а также осуществлять
прием таким способом, что в случае мобильных ситуаций, независимо от того, изменяет ли свое местоположение говорящее лицо или изменяется его звуковая окружающая среда, если, например, присоединяются другие люди, при этом непрерывно изменяющаяся последовательность событий, т.е. актуальная
для данного лица прослушиваемая перспектива, передается в ее полной реальности. Возникает впечатление, что соответствующий слушающий партнер разговора находится, если можно так выразиться, в той
же самой комнате с говорящим, со всеми свойственными активному, живому и не в последнюю очередь
обусловленными желательной мобильностью разговору, изменяющимися отражениями и функциям дифракции, которые обычно имеют место, когда ведут разговор с собеседником в определенной окружающей среде, и к чему естественным образом привыкли.
-4-
013670
Из-за этого, а также потому, что расстояние от бинаурально принимающих микрофонов до рта соответствующего говорящего лица не изменяется, динамические соотношения остаются неизменными,
т.е. силу звука не требуется постоянно регулировать, так что можно реализовать надлежащую разборчивость речи высокого качества по сравнению с исключительно применяемой в настоящее время узкополосной передачей "простого голоса" без живого качества естественных пространств, многогранных
структур дифракции, резонанса и отражения, которые формируются уже непосредственно в пределах
окружающей среды, а также сложных суперпозиций, обусловленных человеческим телом, а именно
верхней частью тела, плечами, головой и т.д., которые в конечном счете сводятся к двухканальной стереофонической функции передачи согласно изобретению.
Меры, представленные в зависимых пунктах, описывают предпочтительные развития и усовершенствования предложенного стереофонического телефонного соединения, как охарактеризовано в основном пункте, или в п.1, формулы изобретения, относящемся к устройству.
Краткое описание чертежей
Примеры осуществления изобретения проиллюстрированы на чертежах и будут далее объяснены в
последующем описании. На чертежах показано следующее:
фиг. 1 - схематичное представление первого варианта осуществления настоящего изобретения в
форме стереофонического телефонного соединения с двумя участниками в различных местоположениях;
фиг. 2 - второй вариант осуществления изобретения, в котором первый участник связан через стереофоническое телефонное соединение с тремя другими участниками, которые находятся вместе в другом местоположении, по типу схемы конференц-вызова.
Описание примеров выполнения
Фундаментальная идея предложенного изобретения состоит в том, чтобы при телефонном телекоммуникационном соединении, независимо от того, осуществляется ли оно полностью через кабель или
полностью или частично беспроводным способом, передать реальную окружающую среду каждого участника разговора в форме персональных трехмерных связанных с головой изображений прослушивания
соответствующей противоположной стороны, особенно также при мобильной передаче, причем каждый
участник располагает, по меньшей мере, двойным микрофонным набором, принимающим бинауральные
сигналы, и стереофоническим головным телефоном или наушниками.
Фиг. 1 показывает предполагаемую ситуацию. Участник А0, голова которого обозначена как 10,
связан через стереофоническую телефонную линию с участником В0, голова которого обозначена как 11.
Каждый участник А0 и В0 использует комбинацию 12 непосредственно рядом с его обоими ушами или
также внутри ушей, но в любом случае в пределах области уха, причем каждая комбинация 12 состоит из
генерирующего звук преобразователя, обычно головного телефона или наушников 13, и микрофона 14
для совместного стереофонического приема или воспроизведения звуковых событий. Поэтому микрофоны 14 находятся рядом или в пределах областей уха, чтобы они во взаимодействии стереофонически
точно были в состоянии принять акустические изображения, называемые связанными с головой изображениями, которые отображают фактическую акустическую окружающую среду участника. Понятно, что
следует позаботиться о свободном от эха или обратной связи соединении или конфигурации микрофонов
с соседними генерирующими звук преобразователями, т.е. головного телефона или наушников, чтобы
соответствующий участник разговора не слышал своего собственного голоса, повторно переданного назад к нему. Такая взаимная акустическая изоляция между головными телефонами или наушниками и
микрофонами, обеспечивающая свободу от обратной связи, может без проблем выполняться специалистом.
Как упомянуто, генерирующие звук преобразователи могут быть различных типов, например супрааурикулярные (расположенные над ушной раковиной) головные телефоны или предпочтительно наушники, чтобы можно было отказаться от охватывающих голову приспособлений для поддержки. В любом случае для усиления и освобождения от искажений получаемых или прослушиваемых сигналов к
этим двум микрофонам (которые совместно формируют стереомикрофон), а также обоим генерирующим
звук преобразователям 13 соответственно подключены схемы усилителя/подавителя искажений 15а для
генерирующих звук преобразователей и 15b для микрофонов, с которыми они соединены через двусторонние двухканальные интерфейсы 16а. Если определить комбинацию 12, назначенную каждому участнику, как первый узел, то схемы усилителя/подавителя помех с соответствующим интерфейсом 16а образуют второй узел 17, который со своей стороны беспроводным или проводным способом при двухканальной передаче подключается к последующему устройству 18 связи, которое, в свою очередь, вновь
беспроводным или проводным способом обеспечивает двухканальное соединение с сетью.
Независимо от того, используются ли внешние, а именно супрааурикулярные открытые или закрытые головные телефоны, или внутриушные телефоны, всегда получаются связанные с головой стереофонические сигналы, которые в случае наушников, на которых тогда микрофоны закреплены или как-то
иначе сопоставлены с ними, использовали бы даже часть ушной раковины в качестве отражательного,
дифракционного и резонансного тела, что дополнительно улучшило бы естественность посылаемых сигналов.
-5-
013670
Ввиду значительных возможностей, предлагаемых сегодня и, очевидно, в будущем, непрерывно
прогрессирующим техническим развитием относительно интеграции компонентов и возрастающей миниатюризации особое преимущество обеспечивается использованием наушников также по той причине,
что миниатюризированные комбинации 12 в этом случае могут быть реализованы соответственно с одним наушником и одним микрофоном также при отказе от проводных подводов и поэтому иным образом, чем показано на чертеже; с общей батареей энергопитания для наушника и микрофона каждой комбинации 12 и общим передатчиком ультракороткой дальности к подключенному конструктивному узлу
17 получается удобное и комфортное качество ношения. Никакие проводные связи не свисают вокруг
головы участника и за исключением легко вставляемой в каждое ухо комбинации из микрофона и генерирующего звук преобразователя нет никакого заметного дискомфорта. Как известно любому пользователю портативного МР3-плеера, например "iPod", наушники особенно предпочтительны в смысле открытых наушников, которые не изолируют пользователя от его акустической окружающей среды, таким образом облегчая любой желательный вид коммуникации.
Соответствующие содержащиеся в узлах 12, 17 и 18 схемные блоки сами по себе понятны для специалиста из приведенных на чертежах надписей. Подавители искажений служат для нормировки сигналов, которая может быть необходимой, когда соответствующие участники разговора работают с различными головными телефонами, выполненными из двух беспроводных гарнитурам, каждая из которых
состоит из микрофона и наушника, чтобы таким образом достичь сопоставимого качества сигнала между
различными головными телефонами. Это может также иметь значение в зависимости от различного позиционирования микрофона, но также и из-за желательной свободы от обратной связи. В данном контексте подавители искажений обеспечивают компенсацию, чтобы в конечном счете доставить стандартизованный сигнал к интерфейсу, который соединяется с терминалом связи.
Для того чтобы желательное разделение отдельных узлов имело смысл, требуются интерфейсы 16а,
16b и 16с в соответственно высококачественном двухканальном выполнении. Они соединены посредством проводного соединения или беспроводного соединения с помощью электромагнитных волн с соответствующими интерфейсами последующего узла.
В принципе, нужно отметить, что показанные на чертеже разделение и распределение различных
конструктивных узлов и/или схемных блоков, прежде всего, удовлетворяют цели лучшего понимания и
наглядности основных функций, соответствующих изобретению. Разумеется, не в последнюю очередь
вследствие достигнутого технического прогресса или иной цели распределения различных частей и их
выполнения другая группировка схемных блоков, а также иным образом спроектированные и взаимосвязанные схемы обработки сигналов могут быть реализованы и использованы.
Фиг. 2 изображает предпочтительный вариант осуществления изобретения в том, что по меньшей
мере на одной стороне имеется несколько участников В, В', В", которые в этом случае находятся в одном
помещении, причем каждый из участников В, В', В" носит головной телефон или комбинацию 12 из микрофона и генерирующего звук преобразователя в области каждого уха, точно так же, как участник А разговора, с которым каждый из участников В, В', В" имеет двухканальное соединение через сеть. С этой
целью каждый из участвующих терминалов 18' связи на фиг. 2 - также и другие участники конференции
А', А" могли бы находиться в области местонахождения участника А - претерпевает изменение в том, что
в двухканальном множественном входном интерфейсе 16b' предусмотрена схема 19 выбора функции
приема. Она имеет задачу, в первом варианте, самостоятельно принимать решение, какая пара микрофонов которого из участников разговора должна быть подключена на выходной сетевой интерфейс 16с' и
должна быть, таким образом, освобождена для передачи через сеть. Это может произойти, например,
путем оценивания динамики речевых сигналов, генерируемых одним из участников В, В', В" в заданный
момент времени, или определением того, кто из участников говорит вообще. Схема выбора функции
приема затем блокирует передачу сигнала микрофона от других участников, но, конечно, не передачу
звукового сигнала к генерирующим звук преобразователям других участников.
Другая возможность этой конфигурации состоит в том, что исходящие от говорящего участника голос и сигналы окружающей среды не только переключаются на его терминал связи для телефонной передачи, но и подаются по электрическому тракту назад посредством схемы 19 выбора функции приема,
содержащейся в оконечном устройстве 18, и посылаются на генерирующие звук преобразователи других
участников, находящихся в том же самом помещении, даже если эти участники могут также услышать
эти речевые сигналы непосредственно через воздух. Фактически, не исключается, что используются генерирующие звук преобразователи, которые затрудняют прямое прослушивание или препятствуют полностью прослушиванию вследствие изоляции.
Если к определенному моменту времени первоначально говорящий участник этой группы из трех
участников, а именно, например, участник В, который говорит первым и соединяется соответственно,
прекратит говорить и если другой участник, возможно В", начинает говорить, то схема выбора функции
приема устройства 18' связи автоматически переключит участника В" на сетевой интерфейс 16с'. Однако
это не означает, что участник на другом конце сети обязательно услышал бы только участника конференции, который теперь включен; в действительности он, естественно, продолжает слышать других участников, хотя и в более слабой форме, в зависимости от их пространственных условий, через стереомик-6-
013670
рофон участника В", так что и в этом случае для участника А создается полная стереопанорама в трехмерном пространственном звучании, практически так, как если бы он находился в той же среде с участниками В, В', В".
Является возможным, дополнительно или вместо автоматического выполнения функции переключения, проектировать ее для выполнения вручную, для произвольного приведения в действие, так что,
например, участник, который хочет высказаться, может привести в действие переключатель по своему
усмотрению и, таким образом, подключается к сети посредством схемы выбора функции приема. Клавиши для схемы приглушения, если, например, должно проводиться конфиденциальное краткое обсуждение, также могут быть предусмотрены. Также предпочтительным образом в зоне схемы выбора функции приема или в ином подходящем местоположении располагаются индикаторы управления и контроля, светодиоды и т.п., которые указывают, кто из участников разговора подключен схемой 19 выбора
функции приема к выходному сетевому интерфейсу 16с'. Так как другие компоненты переключения варианта схемы конференц-связи по фиг. 2 соответствуют схемным блокам по фиг. 1, не требуется обсуждать их подробно снова; также опускается повторение привязки ссылочных позиций схемных блоков,
которые уже были обсуждены и изображены с их функциями на фиг. 1.
В отношении декодеров или кодеров сигнала и канала в терминале связи нужно добавить,
что декодеры и кодеры сигнала выполняют цифроаналоговые и аналого-цифровые преобразования, а
также определения ширины полосы (ширина полосы сигналов может составлять по меньшей мере
3,4, или 8, или 16 кГц). Они также гарантируют наименьшие возможные различия в групповой задержке,
причем также когерентность между каналами при кодировании/декодировании по возможности не изменяется, в то время как канальное кодирование/декодирование приводит в соответствие сигналы в целом с
соответствующей сетью, причем на этом месте стереосигналы уже мультиплексированы в один сигнал
вместе с любыми вспомогательными данными. Кроме того, эти кодеры и декодеры обеспечивают необходимую избыточность, а также обнаружение ошибок и их исправление. Идеально, время одностороннего распространения, включая кодирование/декодирование сигнала и передачу, составляет менее
120 мс, так что своевременная передача сигнала гарантируется без создающих помехи задержек. Следует
остановиться на другом выгодном воплощении изобретения, которое состоит в размещении дополнительного отдельного микрофона предпочтительно близко ко рту каждого участника разговора, который
или обеспечивает дополнительное подмешивание в стереосигнал в качестве опорного микрофона некоторого рода, например, чтобы дополнительно улучшить разборчивость, или, альтернативно, может полностью заменить стереосигнал бинауральной микрофонной пары. Однако при этом возвращаются в область обычной монофонической телефонии, даже при том, что используются бинауральные головные
телефоны; однако все же можно осуществить эту возможность, когда при определенных обстоятельствах
и, возможно, даже с самого начала разговора отказываются от стереофонической передачи информации
окружающей среды, когда она больше не важна или не желательна. Это может случиться, например, когда в ходе разговора переключаются на такую монофоническую операцию только для передачи речевой
информации, при этом можно уменьшить ширину полосы передачи сигнала и соответствующие затраты.
Соответствующие меры могут быть интегрированы в существующую конфигурацию без каких-либо
проблем путем добавления простого переключателя, управляемого на стороне участника.
Понятно, что все признаки, представленные в описании, в последующей формуле изобретения и, в
частности, на чертежах могут быть существенными для настоящего изобретения как в отдельности, так и
в любых комбинациях друг с другом.
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ стереофонического приема, передачи и воспроизведения звуковых событий для приложений связи в телефонии, в которой для каждого участника используются головной телефон и наушники, отличающийся тем, что каждой области левого и правого уха каждого участника сопоставлена комбинация из наушника или головного телефона и микрофона, расположенных в непосредственной близости друг к другу в соединении, свободном от обратной связи между наушником или головным телефоном и микрофоном, посредством чего реальная акустическая окружающая среда каждого участника принимается бинаурально в реальном времени, и, таким образом, ее соотношение с головой соответствующего участника сохраняется в терминах отражательных, дифракционных и резонансных характеристик,
и принятая акустическая среда передается одному или более другим участникам в форме бинаурального
стереофонического звука и прослушиваемых изображений по двухканальному соединению.
2. Способ по п.1, отличающийся тем, что двойная комбинация, состоящая из упомянутых двух отдельных комбинаций, соотнесенных с левым и правым ухом, соответственно, является частью мобильного телефонного устройства передачи и приема с батарейным питанием, которое прикрепляется или используется на теле участвующего в телефонном трафике лица, для передачи его соответствующих персональных, соотнесенных с головой акустических изображений.
3. Способ по п.1 или 2, отличающийся тем, что в случае конференц-вызовов каждый находящийся в
том же самом помещении участник разговора селективно переключается в локальную сеть, соединяю-7-
013670
щую всех участников разговора, либо посредством автоматического переключения, обусловленного собственно процессом разговора, либо посредством намеренно приводимого в действие переключения через
схему, которая выбирает прием звукового изображения данного участника.
4. Способ по любому из пп.1, 2 или 3, отличающийся тем, что в случае нескольких участников конференц-вызова, находящихся в том же самом помещении, каждый из участников, не говорящих в текущий момент, будет иметь, по меньшей мере, сигнал разговора, электрически направляемый на его бинауральные головные телефоны или наушники через устройство связи в дополнение к естественной акустической передаче помещения.
5. Способ по любому из пп.1-4, отличающийся тем, что каждый участник разговора может передать
тональные или звуковые последовательности (подобные музыкальным фрагментам или песням), которые
сохранены в его соответствующем стереофоническом и возможно мобильном телефоне (подобном сотовому телефону с МР3-плеером), вместе со стереофонической передачей голоса и окружающей среды,
если желательно.
6. Способ по п.5, отличающийся тем, что такие добавленные аудиосигналы подвергаются бинауральному направленному кодированию во избежание "локализации в голове" таких добавленных аудиосигналов при воспроизведении через головные телефоны или наушники.
7. Устройство для выполнения способа приема, передачи и воспроизведения по одному или нескольким из пп.1-6, отличающееся тем, что для одновременного бинаурального стереофонического
приема, передачи и воспроизведения звука реального времени и прослушиваемых изображений, которые
сохраняют свое соотношение с головой принимающего участника в его реальной среде в терминах их
характеристик отражения, дифракции и резонанса, комбинация (12) генерирующего звук преобразователя (головного телефона или наушника 13) и микрофона (14) предусмотрена для каждой области левого и
правого уха любого участника разговора (А, В, В', В"), причем генерирующий звук преобразователь и
микрофон каждой комбинации (12) размещены в непосредственной близости друг к другу так, чтобы
избежать обратной акустической связи и/или явлений эхо между головным телефоном или наушником и
микрофоном.
8. Устройство по п.7, отличающееся тем, что двойная комбинация для бинаурального приема и воспроизведения, состоящая из комбинации генерирующего звук преобразователя (головного телефона или
наушника) и микрофона, для каждого уха соответствующего участника телекоммуникации, является частью мобильного телефонного устройства с батарейным питанием, носимого соответствующим участником.
9. Устройство по п.7 или 8, отличающееся тем, что двухканальные схемы усилителя/подавителя искажений (15а, 15b), а также схемы кодера и декодера сигнала и канала предусмотрены отдельно для микрофонов и генерирующих звук преобразователей, соответственно, для последующей двухканальной обработки локально полученных или принятых сигналов.
10. Устройство по любому из пп.7, 8 или 9, отличающееся тем, что двусторонние двухканальные
интерфейсы (16а, 16b), a также оконечный интерфейс (16с) подсоединены к или между индивидуальными схемами обработки сигнала в соответствии с их расположением по отношению друг к другу, с беспроводной или проводной передачей между двусторонними интерфейсами или между оконечным интерфейсом и сетью.
11. Устройство по любому одному или нескольким из пп.7-10, отличающееся тем, что в случае нескольких участников разговора в том же самом помещении предусмотрен двухканальный множественный интерфейс (16b'), с которым соединены отдельные участники разговора с выходным сигналом их
соответствующей обработки персонального сигнала, и предусмотрена схема (19) выбора функции приема для автоматического или произвольного переключения между бинауральными микрофонными сигналами, принимаемыми от одного их участников (В) разговора, на те, которые принимаются от других (В'
или В'') для передачи в сеть.
12. Устройство по любому из пп.7-11, отличающееся тем, что первая группа схем, состоящая из
двух относящихся к области уха комбинаций (12), каждая их которых содержит микрофон (14) и головной телефон или наушники (13), соединена со второй группой (17) схем, состоящей из схем усилителя/подавителя искажений для головных телефонов или наушников и микрофонов, которая, в свою очередь, соединена с терминалом (18) связи через двусторонние проводные или беспроводные двухканальные интерфейсы (16а, 16b), причем терминал (18) связи включает в себя кодеры и декодеры сигналов и
кодеры и декодеры каналов, и, в случае множества локальных участников конференц-связи, множественный интерфейс (16b') на входной стороне, к которому добавлена схема (19) выбора, снабженная индикаторами управления и контроля, для функции приема, при этом выполняется автоматическое или
произвольное направление выходного сигнала конкретного участника разговора в телекоммуникационную сеть.
13. Устройство по любому одному или нескольким из пп.7-12, отличающееся схемной конфигурацией, посредством которой стереофоническая связь может переключаться двусторонним образом в желательный момент времени на монофонический режим.
14. Устройство по любому одному или нескольким из пп.7-13, отличающееся включением третьего
-8-
013670
микрофона вблизи рта соответствующего участника для подмешивания, если желательно, опорного речевого сигнала к передаваемому стереосигналу или для обеспечения возможности монофонического режима по п.13.
Фиг. 1
Фиг. 2
-9-
013670
Евразийская патентная организация, ЕАПВ
Россия, 109012, Москва, Малый Черкасский пер., 2
- 10 -
Download