-
Создать репозиторий на основе данного шаблона (Нажать зелёную кнопку
Use this template-> Create a new repository. Имя репозитория можно задать произвольно) -
Создать ветку
develop -
Выполнить задание. Весь код необходимо писать в файле
signer.go -
Создать Pull Request (PR) на слияние ветки
developв веткуmain -
Добавить в качестве соавтора репозитория (Settings -> Access -> Collaborators ->
Add people) и указать в качестве ревьюера (Reviewers) человека, чей никнейм на GitHub Вам будет сообщёнP.S. Прежде чем указать человека в качестве ревьюера, необходимо будет подождать, пока он примет Ваше приглашение быть соавтором репозитория.
-
Если тесты проходят успешно, на странице PR-а должна появиться зелёная галочка
-
Сливать ветки можно только после одобрения ревьюера!
В этом задании мы пишем аналог unix pipeline, что-то вроде:
grep 127.0.0.1 | awk '{print $2}' | sort | uniq -c | sort -nrКогда STDOUT одной программы передаётся как STDIN в другую программу.
Но в нашем случае эти роли выполняют каналы, которые мы передаём из одной функции в другую.
Это сложное задание, не стесняйтесь просить помощи. Оно делается не сразу, но когда в голове "щёлкнет", всё станет очень просто.
Задание по применению материалов лекции. Всё, что Вам необходимо, есть в коде лекции.
Само задание по сути состоит из двух частей:
- Написание функции
ExecutePipeline, которая обеспечивает конвейерную обработку функций-воркеров (которые выполняют какие-то действия) - Написание нескольких функций, которые считают некоторую условную хеш-сумму от входных данных
Расчет хеш-суммы реализован следующей цепочкой:
SingleHashсчитает значение crc32(data)+"~"+crc32(md5(data)) (конкатенация двух строк через~), гдеdata- то что пришло на вход (по сути - числа из первой функции).MultiHashсчитает значение crc32(th+data) (конкатенация цифры, приведённой к строке, и строки), гдеth=0..5(т.е. 6 хешей на каждое входящее значение), потом берёт конкатенацию результатов в порядке расчета (0...5), гдеdata- то, что пришло на вход (и ушло на выход изSingleHash).CombineResultsполучает все результаты, сортирует, объединяет отсортированный результат через_(символ подчеркивания) в одну строку.crc32считается через функциюDataSignerCrc32.md5считается черезDataSignerMd5.
В чем подвох:
DataSignerMd5может одновременно вызываться только 1 раз, считается 10 мс. Если одновременно запустится несколько - будет перегрев на 1 сек.DataSignerCrc32, считается 1 сек.- На все расчеты у нас 3 сек.
- Если делать "в лоб", линейно, для 7 элементов выполнение расчетов займёт почти 57 сек. Следовательно, их нужно как-то распараллелить.
Результаты, которые выводятся если отправить 2 значения (закомментировано в тесте):
0 SingleHash data 0
0 SingleHash md5(data) cfcd208495d565ef66e7dff9f98764da
0 SingleHash crc32(md5(data)) 502633748
0 SingleHash crc32(data) 4108050209
0 SingleHash result 4108050209~502633748
4108050209~502633748 MultiHash: crc32(th+step1)) 0 2956866606
4108050209~502633748 MultiHash: crc32(th+step1)) 1 803518384
4108050209~502633748 MultiHash: crc32(th+step1)) 2 1425683795
4108050209~502633748 MultiHash: crc32(th+step1)) 3 3407918797
4108050209~502633748 MultiHash: crc32(th+step1)) 4 2730963093
4108050209~502633748 MultiHash: crc32(th+step1)) 5 1025356555
4108050209~502633748 MultiHash result: 29568666068035183841425683795340791879727309630931025356555
1 SingleHash data 1
1 SingleHash md5(data) c4ca4238a0b923820dcc509a6f75849b
1 SingleHash crc32(md5(data)) 709660146
1 SingleHash crc32(data) 2212294583
1 SingleHash result 2212294583~709660146
2212294583~709660146 MultiHash: crc32(th+step1)) 0 495804419
2212294583~709660146 MultiHash: crc32(th+step1)) 1 2186797981
2212294583~709660146 MultiHash: crc32(th+step1)) 2 4182335870
2212294583~709660146 MultiHash: crc32(th+step1)) 3 1720967904
2212294583~709660146 MultiHash: crc32(th+step1)) 4 259286200
2212294583~709660146 MultiHash: crc32(th+step1)) 5 2427381542
2212294583~709660146 MultiHash result: 4958044192186797981418233587017209679042592862002427381542
CombineResults 29568666068035183841425683795340791879727309630931025356555_4958044192186797981418233587017209679042592862002427381542
Код писать в signer.go. В этот файл не надо добавлять ничего из common.go.
Запускать тесты при помощи команды: go test -v -race
- Задание построено так, чтобы хорошо разобраться со всем материалом лекции, т.е. вдумчиво посмотреть примеры и применить их на практике. Искать по гуглу или Stack Overflow ничего не надо.
- Вам не нужно накапливать данные - сразу передаём их дальше (например awk из кода выше - на это есть отдельный тест. Только если для реализации ф-ции не нужно специально накапливать данные - у нас это функция
CombineResults). - Подумайте, как будет организовано завершение функции если данные конечны. Что для этого надо сделать?
- Если Вам встретился рейс (опция
-race), исследуйте его вывод: когда читаем, когда пишем, из каких строк кода. Там, как правило, содержится достаточно информации для нахождения источника проблемы. - Прежде, чем приступать к распараллеливанию функций, чтобы уложиться в отведённый таймаут, напишите линейный код, который будет выдавать правильный результат. Лучше даже начать с меньшего количества входных значений.
- Вы можете ожидать, что у Вас никогда не будет более 100 элементов во входных данных.
- Ответ на вопрос "Когда закрывается цикл по каналу?" помогает в реализации функции
ExecutePipeline. - Ответ на вопрос "Мне нужны результаты предыдущих вычислений?" помогают распараллелить
SingleHashиMultiHash. - Хорошо помогает нарисовать схему рассчетов.
- Естественно, нельзя самим считать хеш-суммы в обход предоставляемых функций - их вызов будет проверяться.
Эталонное решение занимает 130 строк с учетом дебага, который Вы видите выше.