Больше информации по резюме будет доступно после регистрации

Зарегистрироваться
Был на сайте меньше недели назад

Кандидат

Мужчина

Активно ищет работу

Санкт-Петербург, готов к переезду, готов к командировкам

Machine Learning, Data Scientist

Специализации:
  • Дата-сайентист

Занятость: полная занятость

График работы: полный день, удаленная работа

Опыт работы 14 лет 7 месяцев

Ноябрь 2024по настоящее время
7 месяцев

Санкт-Петербург

Data Scientist
1. (в работе) LLM модель, где вместо transformers с их механизмом attention используется более прогрессивная mamba. В качестве затравки используется предобученная на данных Reddit embedding из библиотеки sense2vec. Эта библиотека разделяет все значения каждого слова по отдельным точкам embedding. Так же использовал word2vec, spaCy. Идея проекта заключается в 1) внедрением большого количества грамматических и иных ограничений уменьшить необходимый для обучения корпус и общее количество параметров 2) контекстный выходной слой представить в виде объектного языка - обобщенных объектов на основе синонимических рядов с обобщенными связями. Для таких объектов и связей создается свой embbedding, Как следствие - создание промежуточного контекстного объектного языка. Это даст возможность создать прозрачную базу знаний
Октябрь 2021Октябрь 2024
3 года 1 месяц
BNOVO

bnovo.ru

Информационные технологии, системная интеграция, интернет... Показать еще

Senior data scientist
Development of Room Management System (RMS) for hotels: -Development of an economo-statistical model of supply/demand and price formation in the hotel business -Prediction of hotel parameters (occupancy, cost, revenue, etc.) for several months based on historical data for all categories of rooms. -Prediction of hotel parameters based on room booking dynamics templates for all room categories. -Optimization of hotel room prices and occupancy rates according to customer behavior statistics. Forecast of optimal prices and room occupancy for several months for all room categories -Clustering of regional hotels based on external and internal data and correlation of parameter behavior. Forecast of their behavior for up to a year -Parameter forecasting and synthesis of its history for a hotel with a short history using clustering of regional hotels. Stack : python: pandas, scikit-learn. SQL, FacebookProphet, NeuralProphet, PyTorch/TensorFlow, ML
Апрель 2021Сентябрь 2021
6 месяцев
Zenmoney

Санкт-Петербург, zenmoney.com

Информационные технологии, системная интеграция, интернет... Показать еще

data scientist
Выявление характерных зависимостей и частоты банковских операций физических лиц. Прогнозирование ежедневных платежей для каждого клиента. Цель - разделить ежемесячные траты клиентов по типам, используя разницу в локальных частотных характеристиках Стек: wavelet-анализ, эмпирическое wavelet-преобразование, wavelet разложение по различным модам и др.
Июль 2020Март 2021
9 месяцев
Incitech

Санкт-Петербург

Информационные технологии, системная интеграция, интернет... Показать еще

Data Scientist
Оптимизация продаж крупной розничной компании (X5 Перекресток): - Создание статистической модели оптимального размещения различных товаров в зале, влияние на совместные продажи. Проверка гипотез - Создание статистической модели влияния размеров полок на продажи и проверка гипотез - Оптимизация дополнительных продаж продуктов в навесных корзинах с учетом совместных продаж продуктов и максимальной дополнительной прибыли 3) Кластеризация магазинов сети Перекресток по внешним и внутренним параметрам с целью обнаружения аномально слабого или сильного менеджмента магазинов 4) Создание рекомендательной системы, рассчитывающей структуру покупательского спроса и кластеры покупателей Стек: Python:scikit learn, pandas. SQL. Big Data:PostgreSQL, Hadoop, Hive, PySpark, ML: регрессии, кластеризации,рекоменд системы, ранжирование, NNMF
Апрель 2020Июнь 2020
3 месяца

Санкт-Петербург, www.aroma.spb.ru

Розничная торговля... Показать еще

Data Analyst
- Создание системы рекомендаций основанной на предпочтениях клиентов -Создания простого чат бота на сайте для динамических рекомендаций продукта - Статистический анализ эффективности специальных акций по продаже продукта и рекомендации к нему Стек: Python: scikit learn, pandas
Март 2019Декабрь 2019
10 месяцев
Red Crown Ltd

Санкт-Петербург

Информационные технологии, системная интеграция, интернет... Показать еще

Математик-разработчик
Разработка алгоритма оптимизации доходов логистической компании, продающей аренду грузовых машин. - Разработана экономическая модель процесса - Создано программное обеспечение на языке python для предварительной обработки информации во временных рядах основных экономических параметров, - Разработка ежедневного почасового прогноза оптимальной цены и оптимальной продажи арендуемых машин на текущий день, следующий день и недельный прогноз с учетом оптимальной загрузки арендуемых машин Стек: Python, Prophet
Сентябрь 2018Февраль 2019
6 месяцев
Softdev

Санкт-Петербург

Инженер-исследователь
Инженер-исследователь - Обнаружение белых медведей на фотографиях большой площади (7.5kx4.5k пикселей). Использовалась TensorFlow методика YOLO-3. Метод был скорректирован для больших фотографий и только двух классов объектов: медведи и арктическая дикая природа - Оптимизация логистической задачи с помощью рекуррентной нейронной сети. Для разработки задачи используется TensorFlow. Рекуррентная нейронная сеть используется для решения задачи, поскольку внешние условия остаются неизменными, а финансовые параметры системы меняются во времени. Оптимизация прибыли добивается оптимизацией функции Потерь Стек: Python, TensorFlow, YOLO
Январь 2016Ноябрь 2017
1 год 11 месяцев
siencetech

Канада, www.sciencetech-inc.com

applied scientist
• Supported Sciencetech Inc web site. • Made preliminary design for customer determined scientific research systems • Made engineer calculations and modeling
Январь 2013Январь 2015
2 года 1 месяц
University of Waterloo

Канада, www.uwaterloo.ca

Research Associate
* Performed data processing of experimental results of light irradiation of organic liquids. Developed software in Python, Matlab and other special software for quantum chemical numerical modeling in Windows and Linux environments. Data analysis was applied to find implicit dependencies in experimental data.The results were published in a special conference issue of a scientific journal. * Analyzed experimental results with Python and Matlab Statistical Multidimensional Data Processing. Multidimensional Multi-Task Clustering and Regression Machine Learning Techniques were used.
Январь 2009Май 2013
4 года 5 месяцев
University of Waterloo

Канада, www.uwaterloo.ca

PhD Candidate
• Developed Python code to calculate quantum mechanical properties of the novel polymer molecules. Performed statistical data processing of the experiments. Results were published in a scientific paper and were included in my Ph.D. thesis. • Performed calculations of nonlinear optical processes using Python software on a network of high-performance Linux-powered computers SHARCNET. Results were published in a scientific journal.
Январь 2008Январь 2008
1 месяц
University of Waterloo

Канада, www.uwaterloo.ca

Research Associate
* Data processing of the interstellar gas spectra. Analyzed a correlation between observed interstellar gas spectra and all possible energy transitions in carbon clusters using Python and Matlab. Results were published in a scientific paper. * Invented a carbon molecule with novel chemical structure. Used Matlab to develop software to predict geometry and fundamental properties of the molecule (such as stability) through simulations and modeling. The compound was found to be stable and further research was undertaken to establish potential applications of the new molecule structure. 3 papers were published.

Навыки

Уровни владения навыками
Продвинутый уровень
Английский язык
TensorFlow
Machine Learning
Python
Базы данных
Data Science
Прогнозирование
Deep Learning
SQL
Статистический анализ
Анализ данных
Математическое моделирование
Математическая статистика
MATLAB
Data Mining
Кластеризацизация
Ранжирование
Нейронные сети
Рекомендательные системы
Средний уровень
PostgreSQL
PyTorch
MySQL
Базовый уровень
Big Data
MongoDB
Spark
Hadoop
Hive
Django Framework
Flask
Уровень не указан
Регрессионный анализ

Обо мне

Software: Python (Numpy, Pandas, Scipy, Scikit-learn, etc) in Windows and Linux environment, Tensorflow, Keras, PyTorch, Matlab; BD: SQL, Postgresql, mysql, Mongo etc BIGDATA: hadoop, hive, pyspark, Data Analysis, Statistical Data Analysis, Machine Learning: regressions, classification, clustering, optimization; recommender systems, time series, objects detection, deep learning other software: Flask, Django, Git, COMSOL Multiphysics, LabVIEW, SAS System, etc Achievements • 18 scientific publications in the last 8 years. • The referee of journals: Canadian Journal of Chemistry, Computational Materials Science, Physica E. Portfolio in Machine Learning: stan.kuzmin.ca References 1. Dr. Walter W. Duley, professor, University of Waterloo, Waterloo, Ontario Canada Phone +1-519-888-4567 x33108 E-mail: wwduley@scimail.uwaterloo.ca 2. Dr. Alexander Shik, professor, University of Toronto, Centre for Advanced Nanotechnology Phone: +1-416-946-7898; E-mail: shik@ecf.utoronto.ca 3. Dr. Sergej Musihin, Professor, Polytechnic University, St.-Petersburg, Russia Phone: +; E-mail: sergei.musikhin@rphf.spbstu.ru 4. Dr. Michal Wesolowski, Research Associate, University of Saskatchewan Canada Phone: +1-306-966-8771; E-mail: mikewesolowski@gmail.com Уважаемый менеджер по кадрам, Меня заинтересовала открытая вакансия на должность в Вашей компании. Мне очень интересны цели и проблемы, которые ставятся для нее. Я уверен что мой больше чем 20 летний комбинированный опыт в математическом моделировании, обработке данных, программировании, в статистике, опыт в Big Data и участие в проектах по машинному обучению делает меня уникальным кандидатом на должность в вашей компании. Более чем 20-летний опыт в решении различных математических и физических проблем на экспертном уровне PhD по физике. Опыт в DataScience насчитывает более 6 лет Я закончил Ленинградский Государственный Университет, Физический Факультет в 1985 году. Работал в разных исследовательских институтах Санкт-Петербурга.Так же мой опыт включает более чем 15-летнюю работу в Канаде. Я закончил докторантуру по специальности Физика в 2013 году в канадском University of Waterloo, факультет Астрономии и Физики, Ontario, Canada. Занимался моделированием, квантовой химией, обработкой данных, статистикой. Участвовал во многих проектах по Машинному Обучению, в том числе как principal developer. (Смотри Portfolio ниже). Программирую на Python, Matlab, Fortran. Опыт работы в TensorFlow, Keras, Git, Flask, Django, и с другими всевозможными программами. Могу встроить алгоритм машинного обучения в веб-приложение. IDE: Pycharm, Spyder, Jupyter. Опыт в различных видах статической обработки и Машинное Обучение: Supervised, Unsupervised, нейронные сети. Использую многочисленные методы регрессий, классификации и кластеризации; системы рекомендаций, работа с временными рядами, глубинное обучение. Имею опыт работы с данными, хорошо знаю SQL, pandas. Опыт работы с Базами данных: PostGreSQL, mysql и другие, работал с Mangodb. Опыт работы с Big Data: Hive, Hadoop, Spark, Greenplum. Если у Вас возникнут вопросы, можете позвонить мне по телефону: +, Whatsup, Telergam (login +1-519-830-5258), Skype, или написать сообщение по email. С уважением, Станислав Кузьмин, Телефон + Email: stan@kuzmin.ca, skype: stkuzmin

Высшее образование (Доктор наук)

2013
University of Waterloo
Astronomy and Physics, Physics
1985
Physics, Applied Mathematics and Physics

Знание языков

РусскийРодной


АнглийскийC2 — В совершенстве


Гражданство, время в пути до работы

Гражданство: Канада, Россия

Разрешение на работу: Канада, Россия

Желательное время в пути до работы: Не имеет значения