ltq-vdsl-mei: add locking to interrupt handler
authorJan Hoffmann <jan@3e8.eu>
Sun, 13 Mar 2022 21:14:38 +0000 (22:14 +0100)
committerHauke Mehrtens <hauke@hauke-m.de>
Tue, 7 Jun 2022 19:36:58 +0000 (21:36 +0200)
commit290c13b7d70b0b396509bf20787ab75ccb057cb7
treeb965064dc0170f358d23dc035682c1d1aef6a6a6
parentd0397abd9d7ef5295d34c02b5bdecfe317a1e1fd
ltq-vdsl-mei: add locking to interrupt handler

Some users noticed repeated resyncs at random intervals, which go away
when the MEI driver is configured to use polling instead of interrupts.
Debugging shows that this seems to be caused by concurrent calls to
MEI_ReadMailbox (in the interrupt handler) and MEI_WriteMailbox. This
appears to be mostly triggered when there is an interrupt for vectoring
error reports.

In polling mode, calls to MEI_ReadMailbox are protected by the same
semaphore as is used in MEI_WriteMailbox. When interrupts are used,
MEI_WriteMailbox appears to rely on MEI_DisableDeviceInt and
MEI_EnableDeviceInt to provide mutual exclusion with the interrupt
handler. These functions mask/unmask interrupts, and there is an
additional check of the mask in the interrupt handler itself. However,
this is not sufficient on systems with SMP, as the interrupt handler
may be running in parallel, and could already be past the interrupt
mask check at this point.

This adds a lock to the interrupt handler, and also acquires this lock
in MEI_DisableDeviceInt. This should make sure that after a call to
MEI_DisableDeviceInt the interrupt is masked, and the interrupt handler
is either not running, has alread finished its work, or is still before
the interrupt mask check, and is thus going to detect the change.

Tested-by: Martin Blumenstingl <martin.blumenstingl@googlemail.com>
Signed-off-by: Jan Hoffmann <jan@3e8.eu>
(cherry picked from commit 17004245534731ab03c9a8683208e84d9c399979)
package/kernel/lantiq/ltq-vdsl-mei/Makefile
package/kernel/lantiq/ltq-vdsl-mei/patches/200-interrupt-lock.patch [new file with mode: 0644]