ГЛАВНАЯ // NEWS


Ученые создали новый эффективный способ подсчета уникальных объектов

Использование случайности помогло группе ученых разработать простой алгоритм для оценки большого количества уникальных объектов в потоке данных.

Представьте, что вас отправили в тропический лес для проведения учета дикой природы. Каждый раз, когда вы видите животное, делаете фото. Ваша камера отслеживает общее количество снимков, но вас интересует только количество уникальных животных, которых еще не было в кадре. Как лучше всего получить это число? Очевидное решение требует запоминания каждого животного и сравнения каждого нового с уже имеющимися в списке, отметил Ланс Фортнау, компьютерный ученый из Технологического института Иллинойса. Однако при тысячах записей такой подход становится сложным.

Ситуация усложняется, если, например, Facebook захочет подсчитать количество уникальных пользователей, заходящих на сайт каждый день, даже если они заходят с нескольких устройств и в разное время. Здесь уже речь идет о списке, который может достигать миллиардов записей.

Недавно ученые описали новый метод приближенного подсчета уникальных записей в длинном списке, который требует запоминания только небольшого числа записей.

Источник: SecurityLab


Powered by Отряд им. 7-го МАЯ